|
2023년 5월 15일 게시됨
소개
2017년 11월, Bob Work 전 국방부 차관은 DOD를 떠난 후 첫 공개 연설을 했습니다. 그는 모인 청중들에게 “AI[인공지능]와 자율성은 21세기 강대국들 사이의 속도감 있는 기술 경쟁이 될 것입니다. . . 이제 미국과 국방부가 카우보이처럼 행동할 때입니다.” [1]
워크는 약 7개월 전 차관으로 재직하면서 DOD의 가장 눈에 띄는 AI 프로그램인 프로젝트 메이븐(Project Maven)으로 더 잘 알려진 알고리즘 전쟁 교차 기능 팀(Algorithmic Warfare Cross-Functional Team)을 시작하는 메모에 서명했습니다 . Project Maven은 원래 기계 학습 AI를 사용하여 드론 비디오 감시 피드에서 개체 감지 및 분류를 부분적으로 자동화하는 좁은 작업에 중점을 두었습니다 . 그러나 Project Maven에 대한 DOD의 야망은 온건하지 않았습니다. 프로젝트 Maven을 첫해까지 감독한 Jack Shanahan 중장은 "Maven은 [국방] 부서의 나머지 부분에서 인공 지능의 전면에 불을 붙이는 불꽃을 일으키는 파일럿 프로젝트, 길잡이가 되도록 설계되었습니다."라고 말했습니다 .
이제 Project Maven이 출시된 지 6년이 되었습니다. AI와 자율 시스템의 불길은 국방부 전체에 퍼졌습니까?
대답에 대한 한 가지 단서는 한 쌍의 AI 소프트웨어 엔지니어가 직접 지원하는 군대의 이야기를 전하는 2022년 7월 뉴스 기사에서 찾을 수 있습니다. 엔지니어들은 최전방 군인들이 실제 전쟁 중에 AI 컴퓨터 비전을 사용하여 위장된 적 표적을 찾는 데 도움이 되는 AI 프로그램을 만들었습니다. 소프트웨어 개발팀은 지상의 병사들과 직접 조율하고 사용자 피드백을 기반으로 AI 기술을 빠르게 반복 및 개선했으며 병사들이 좋아하는 기능을 제공했습니다. AI로 구동되는 군대에 대한 Work의 비전이 실현되었다고 생각할 수도 있습니다.
하지만 반전이 있습니다. 뉴스 기사 의 군대는 우크라이나인이며 그들이 사용하는 고급 AI 시스템은 미군이나 미국 회사에서 제공하는 것이 아니라 우크라이나 소프트웨어 엔지니어 자원 봉사자 2명으로 구성된 팀이 개발한 것입니다. 아마도 가장 충격적인 사실은 이 두 엔지니어가 몇 주 만에 실제 전쟁에서 실제 전투원에게 진정한 가치를 제공하는 AI 시스템을 개발하고 배치했다는 것입니다. DOD 소프트웨어 개발은 AI와 관련되지 않은 노력의 경우에도 일상적으로 수년이 걸립니다 .
그의 입장에서 Work는 DOD의 전반적인 진행 속도에 실망했습니다. 워크는 2021년 AI 국가안보위원회 부위원장 시절 기자회견에서 “우리는 [AI] 경쟁에서 이기기 위한 조직을 조직 하지 않았고, 경쟁에서 이기기 위한 전략도 없다. 전략이 있더라도 전략을 실행할 리소스가 없습니다.” 부서의 AI 변환 속도에 불만을 표명하는 전직 DOD 관리의 관점에서 업무는 혼자가 아닙니다 .
Project Maven 출시 이후 AI 채택을 가속화하기 위한 DOD의 노력에서 많은 성과를 거두었습니다. 그러나 이 부서는 AI 및 자율 시스템 기술, 가장 최근에는 생성 AI 에서 놀라운 혁신을 지속적으로 제공하는 상업 산업에 비해 여전히 크게 뒤떨어져 있습니다 .
2개의 시리즈 중 첫 번째인 이 백서는 수개월에 걸친 CSIS 연구와 전문가와의 비공개 원탁회의, 그리고 수십 건의 인터뷰를 기반으로 작성되었으며, 그 중 다수는 비기여 기반으로 수행되었습니다. AI 및 자율 기술과 관련된 DOD, 동맹국 및 민간 부문 구성원.
이 백서는 DOD AI 프로그램 관리자의 눈을 통해 본 DOD AI 및 자율성 채택과 이들이 직면한 문제를 조사합니다. 그렇게 함으로써 우크라이나 자원봉사자들이 몇 주 안에 영향력 있는 군사 AI 소프트웨어를 배치할 수 있는 이유에 대한 새로운 통찰력을 제공하는 반면, 국방부의 많은 부분은 종종 훨씬 더 많은 시간과 자원이 있어도 그렇게 하기 위해 고군분투합니다.
이 첫 번째 백서의 목적은 AI로 문제를 해결하려는 DOD 조직이나 지도자가 직면한 문제를 정직하고 솔직하게 탐구하는 것입니다. 두 번째 보고서는 지난 6년 동안 DOD AI와 자율성 노력에서 얻은 교훈을 적용하고 이러한 장벽 중 일부를 줄이고 기술 채택을 가속화하는 방법에 대해 정책 입안자와 DOD 지도자에게 권장 사항을 제시합니다.
고품질의 영향력 있는 AI 지원 기능을 개발하고 DOD의 사용자에게 배포하려면 임무, 데이터, 컴퓨팅 인프라, 기술 인재, 최종 사용자 피드백, 예산 등 6가지 중요한 입력이 효과적으로 결합되어야 합니다.
잠재적인 AI 사용 사례는 거의 기존 소프트웨어의 사용만큼 다양하기 때문에 이 문서에서는 체크리스트를 제공하지 않습니다. 대신 위에 나열된 6가지 중요한 입력 사항을 검토하고 DOD AI 및 자율 프로그램 관리자가 주어진 문제에 대한 AI 솔루션을 추구할 때 대답할 준비가 되어 있어야 하는 주요 질문을 제공합니다. 이러한 과제 중 일부는 일반적으로 AI 기술과 관련이 있으며 AI의 상업 및 정부 채택 모두에 적용됩니다. 그러나 DOD가 직면한 가장 중요한 AI 채택 문제 중 다수는 DOD 및 정부 상황에 특정한 관료적 및 구조적 제약과 관련이 있습니다. 이 논문은 이러한 질문에 대한 명확하고 실행 가능한 답변 없이는
질문은 다음과 같습니다.
앞서 언급한 바와 같이 이 백서는 첫 번째 백서이며, 두 번째 백서는 미션 임팩트를 위한 AI 및 자율 시스템의 채택을 신속하게 가속화하기 위해 DOD가 추구해야 하는 영향력 있는 솔루션에 초점을 맞출 것입니다.
질문 1: 임무
어떤 문제를 해결하려고 하며 AI가 올바른 솔루션인 이유는 무엇입니까?
기술적 우월성이 미군의 핵심 기반 중 하나라는 것은 절대적으로 사실이지만, 이 사실이 널리 받아들여지면서 모든 종류의 기술적 진보가 전반적인 전략적 목표에 중요한 것은 아니라는 사실을 쉽게 잊게 되었습니다.
다음과 같은 간단한 사고 실험을 생각해 보십시오. 자동차 공장은 한 달에 자동차 엔진 10개와 바퀴 100개를 생산할 수 있습니다. 자동차를 만드는데 엔진 1개와 바퀴 4개가 필요하다면 공장에서 한 달에 몇 대의 자동차를 생산할 수 있습니까?
대답은 10입니다. 엔진은 생산 속도를 제한하는 요인(또는 "병목 현상")이기 때문입니다.
이제 공장에서 월간 바퀴 생산량을 3배로 300개로 늘리는 새로운 AI 지원 시스템을 설치한다고 가정해 보겠습니다. 공장에서 한 달에 몇 대의 자동차를 생산할 수 있습니까?
바퀴가 아닌 엔진이 생산 병목 현상을 일으키고 새로운 AI 시스템이 엔진 생산을 개선하는 데 아무 것도 하지 않았기 때문에 여전히 10입니다.
제조 분야에서 사실인 것은 전쟁에서도 마찬가지입니다. 중요한 것은 전체 프로세스 병목 현상에서 생산성 향상입니다. 공군 기지 활주로와 연료 탱크가 장거리 미사일에 의해 파괴되어 전투에서 패배할 가능성이 있는 경우(공군을 대신하여 수행되는 최근 RAND 워게임의 공통 관심사 ) 공중에서 은밀하거나 더 치명적인 것은 지상의 취약성에 의해 결정되기 때문에 전장 결과에 거의 영향을 미치지 않을 수 있습니다.
위의 사고 실험은 잠재적으로 AI를 채택하는 데 관심이 있는 DOD 리더에게 간단한 통찰력을 제공합니다. 즉, 리더는 자신이 해결하고 있는 문제가 실제로 전체 임무 효율성의 병목 현상임을 확인해야 합니다. 이 프레임에서 접근할 때 문제는 본질적으로 "AI를 채택해야 합니다"가 아닙니다. AI 지원 시스템은 목적 자체가 아니라 목적을 위한 가능한 수단이기 때문입니다. 한 DOD 리더는 인터뷰에서 CSIS에 이렇게 말했습니다.
프로그램 관리자가 문제가 무엇인지 명확하게 알게 되면 AI 지원 기능이 솔루션의 일부가 될 자격이 있는지 탐색을 시작할 수 있습니다. 이를 위해서는 AI 시스템이 원하는 수준의 성능을 제공하기 위해 갖추어야 할 요소와 함께 현대 AI가 할 수 있는 것과 할 수 없는 것에 대한 현실적인 이해가 필요합니다 . 예를 들어 2016년 AlphaGo(전략 보드 게임 바둑을 하기 위한 AI 시스템)가 세계 챔피언을 물리친 후 일부 미국 과 중국 군대 에서 흥분이 일었습니다.초인적인 전략적 사고를 가진 "AI 사령관"이 가까운 지평에 있을 수 있다는 서클. 이러한 잘못된 사고 방식은 AI 엔지니어링 관점에서 Go의 편리한 속성이 무엇인지, 그리고 AI 분야의 진정한 연구 혁신인 Go에서 AI의 성공이 반드시 일반화되지 않는 이유를 인식하지 못한 결과입니다 .단기적으로 다른 전략 계획 응용 프로그램에 적용할 수 있습니다. 바둑과 전쟁의 수많은 차이점 중에서 바둑 게임용 디지털 시뮬레이터는 수학적으로 실제 보드 게임 바둑과 동일합니다. 즉, 시스템을 상대로 게임을 함으로써 거의 무한에 가까운 고품질 훈련 데이터를 빠르고 저렴하게 생성할 수 있습니다. 그 자체. 오늘날의 AI 기술을 사용하여 전쟁 시뮬레이션에서 자신과 대결하는 AI 군사 전략 시스템은 유용한 군사 전술을 배우는 것만큼이나 시뮬레이션의 한계를 활용하는 방법을 배울 가능성이 높습니다.
군사 시뮬레이션은 인간 훈련에 많은 유익한 용도가 있으며 고급 시뮬레이션은 자율 주행과 같은 고급 AI 시스템 개발의 일부이기도 합니다.[2] 그럼에도 불구하고 AI 연구에 대한 뉴스를 읽는 비전문가 독자들은 결론을 내릴 때 주의해야 합니다. 또한 AI는 개별 항목이 아니라 전기나 컴퓨터와 유사한 범용 기술입니다. 잠재적인 AI 사용 사례의 폭은 워드 프로세싱 및 미사일 유도 시스템만큼 근본적으로 다른 기능을 뒷받침하는 기존 소프트웨어만큼 광범위합니다.
이것은 AI가 매우 유망한 군사적 사용 사례가 없다는 것을 말하는 것이 아닙니다. 절대적으로 그렇습니다. 예를 들어 인공위성 이미지 인식을 위한 컴퓨터 비전 AI의 경우를 보자. 주요 상업 위성 운영업체인 Maxar Technologies는 너무 많은 데이터를 수집하는 대규모 이미지 위성을 보유하고 있어 Maxar는 하루 분량의 이미지 수집에서 모든 물체를 식별하는 데 인간 분석가의 노력이 85년이 걸릴 것으로 추정합니다 .
Maxar의 경우 컴퓨터 비전 AI를 사용해도 인간 이미지 분석의 필요성이 없어지지는 않지만 해당 이미지에 대한 1차 분석을 수행하여 인간 분석가의 생산성을 크게 향상시킵니다. AI 시스템은 활동의 최근 변경 사항이나 기타 주목할만한 기능을 포함하고 있기 때문에 흥미로울 것 같은 이미지를 식별합니다. AI의 분석 결과는 인간 분석가가 검토할 이미지의 우선 순위를 지정하는 데 도움이 됩니다. 핵심은 Maxar의 AI 사용이 회사의 전반적인 운영 병목 현상(이미지 분석 용량 부족)을 해결하고 AI 시스템의 약점이 완화됩니다.
기계 학습을 사용하는 최신 AI 시스템은 방대한 양의 데이터를 처리하고 감지, 분류, 예측, 최적화 및 자동화된 의사 결정과 같은 작업에 유용한 방식으로 패턴을 찾는 데 능숙합니다. AI는 데이터 속도나 크기가 인간이 현실적으로 관리하기에는 너무 극단적일 수 있는 문제 해결의 속도와 규모를 지원합니다. 그러나 다른 도구와 마찬가지로 AI는 특정 상황에서만 잘 작동하며 AI가 모든 생산성 문제에 대한 만병통치약은 아닙니다.
DOD AI 리더의 핵심은 AI 인재 및 기능 풀을 구축한 다음 이를 운영 커뮤니티의 우선 순위가 높고 최신 AI 기능으로 가장 잘 해결되는 문제에 연결하는 것입니다. 올바른 중첩을 찾으려면 많은 논의, 실험 및 오류가 필요합니다. 이것은 주어진 AI 사용 사례에 대해 올바른 성공 요인이 있는지 확인하는 데 초점을 맞춘 후속 질문으로 이어집니다.
질문 2: 데이터
AI 시스템을 개발하고 운영하는 데 필요한 올바른 종류의 데이터를 어떻게 충분히 얻을 수 있습니까?
DOD 프로그램 관리자는 AI 기술에 대한 확고한 이해가 필요합니다.AI 지원 기능 개발 노력을 시작하기 전에 주로 기계 학습을 기반으로 하는 최신 AI의 경우 데이터는 프로그램 관리 및 시스템 성능의 거의 모든 측면에서 매우 중요합니다. 기계 학습 소프트웨어는 시스템의 많은 "지능"이 인간에 의해 프로그래밍되지 않고 대신 데이터에서 학습된다는 점에서 기존의 규칙 기반 소프트웨어와 다릅니다. 다음 그림은 훈련 단계에서 AI 모델을 개발하고 훈련된 AI 모델을 운영적으로 사용하기 위한 두 가지 유형의 데이터 간의 차이점을 보여줍니다. 이 수치는 머신 러닝의 지도 학습 제품군을 사용하는 노력이라고 가정하며, 이는 DOD에서 전부는 아니지만 대부분의 AI 사용 사례에 해당됩니다.
감독 머신 러닝을 위한 간소화된 프로세스 다이어그램
영상
출처: 저자의 창조
위의 그림에서 알 수 있듯이 데이터는 최신 AI의 기반입니다. 다행스럽게도 2020 DOD 데이터 전략 과 2021 국방부 차관 각서인 " 데이터 이점 창출 "은 모두 "데이터는 전략적 자산"이라고 강력하게 강조합니다.
그럼에도 불구하고 데이터 관련 문제는 DOD에서 AI 개발 및 배포에 가장 중요한 장벽으로 남아 있습니다. 이는 DOD의 일부, 특히 정보 커뮤니티에서 수십 년 동안 막대한 양의 데이터를 축적했기 때문에 직관에 반하는 것처럼 보일 수 있습니다. 그러나 양이 문제가 아닌 경우에도 AI 개발 및 채택에 장애가 되는 데이터 구성, 저장, 향상 및 액세스 방법과 관련된 다양한 문제가 있습니다. 다음 섹션에서는 위성 이미지 분류기 AI 시스템의 예를 사용하여 이러한 문제 중 일부를 살펴봅니다.
첫째, 훈련 데이터는 일반적으로 응용 프로그램에 따라 다릅니다. 위성영상인식 훈련 데이터는 위성영상인식 AI 구축에만 도움이 된다. 또한 조직에서 위성영상인식 AI를 구축하고자 한다면 위성영상 트레이닝 데이터만 있으면 된다. 위성 이미지 인식 AI를 교육하기 위해 레이블이 지정된 얼굴 초상화 이미지 또는 상업 금융 데이터를 마술처럼 사용할 수 없습니다.
둘째, 최신 기계 학습 시스템에는 많은 양의 훈련 데이터가 필요합니다. 편리하게도 정찰 위성을 포함한 많은 DOD 센서 시스템의 경우 생성되는 데이터의 양이 놀라울 정도로 많습니다. 그러나 AI 관점에서 기가바이트 또는 페타바이트 측면에서 데이터의 양은 이야기의 일부일 뿐입니다. 다시 말하지만 대부분의 DOD AI 애플리케이션에 가장 관련성이 높은 기계 학습 패러다임인 감독 기계 학습의 경우 더 중요한 지표는 훈련 데이터 세트의 예 수입니다. 예를 들어 위성 이미지 인식 AI 분류 시스템에는 각 클래스(예: "차량", "건물", "도로") 및 하위 클래스(예: "러시아 T-72 탱크")에 대해 수만 개의 레이블이 지정된 이미지가 필요합니다. 시스템이 컴퓨터 비전 기능에 포함시키려는 객체의 게다가, 이러한 레이블을 적용하는 방법에는 일관성이 있어야 합니다. AI 지원 컴퓨터 비전 애플리케이션의 경우 일반적으로 사용되는 데이터 라벨링에 대한 세 가지 주요 접근 방식이 있습니다.
위의 예는 모든 독자가 컴퓨터 비전 AI 기능을 위한 데이터 레이블 지정에 대한 세 가지 접근 방식을 암기해야 한다고 제안하려는 것은 아닙니다. 오디오, 텍스트, 테이블 형식 또는 RADAR와 같은 다른 유형의 데이터로 작업하는 프로그램은 각각 다른 접근 방식을 사용합니다. 오히려 중요한 점은 데이터 라벨링이 개발 및 운영 단계 모두에서 대부분의 DOD AI 기능의 복잡하고 중요한 단계라는 것입니다. 주어진 AI 프로젝트 또는 프로그램의 실행 가능성, 성공 또는 실패를 결정하는 많은 전략적 선택은 잘 정의된 데이터 레이블 지정 프로그램 아키텍처 및 레이블이 지정된 대량의 데이터를 획득하고 지속적으로 업데이트하는 명확한 경로가 있는지 확인하는 것과 직접적으로 관련됩니다. AI 모델을 위한 훈련 데이터 세트.
자율주행 애플리케이션을 위한 AI 연구개발에 수십억 달러를 투자한 테슬라의 경우를 보자. 2021년 인터뷰 에서 당시 Tesla의 AI 및 Autopilot Vision 책임자였던 Andrej Karpathy는 Tesla의 데이터 라벨링 및 데이터 큐레이션 접근 방식에 대해 다음과 같이 말했습니다.
소화전을 인식하기 위해 [자동차의 AI]가 필요한 경우 절대적으로 가능하지만 10,000개의 예, 50,000개의 예가 필요합니다. . . 모든 가능한 회전 및 가능한 모든 밝기 조건에서. . . 실제로 우리는 Tesla 내부에서 성장한 전체 데이터 라벨링 조직을 보유하고 있습니다. 이것이 우리가 하는 일의 기본이기 때문입니다. . . 우리는 데이터 세트를 큐레이팅하는 고도로 전문적이고 고도로 훈련된 인력을 보유하고 있으며 이것이 새로운 소프트웨어 프로그래밍 패러다임이고 이들이 우리의 새로운 프로그래머이기 때문에 이것이 올바른 방법이라고 생각합니다. . . 예제에 주석을 달 때 시스템에 장면을 해석하는 방법을 알려주고 말 그대로 자동 조종 장치를 프로그래밍하므로 조직에 상당한 투자를 하고 긴밀하게 유지하며 엔지니어와 매우 협력합니다. 면밀히.
Karpathy가 분명히 밝혔듯이 고성능 AI 시스템에 대한 데이터 및 데이터 라벨링 요구 사항은 방대합니다.
또한 적절한 양의 데이터뿐만 아니라 적절한 다양성과 다양성을 확보하는 것이 과제입니다. AI 컴퓨터 비전 애플리케이션의 경우 교육 데이터 세트의 이미지는 다양한 이미지 특성(예: 시점 변화(객체가 카메라를 기준으로 방향이 지정되는 방식), 조명 조건(주/야간), 및 폐색 조건(객체가 이미지의 다른 사물에 의해 부분적으로 가려지는 정도).
Project Maven을 지원하는 업계 팀도 Tesla가 직면한 문제와 유사한 문제를 해결하는 대규모 팀을 보유하고 있었습니다. 처음부터 프로젝트 Maven에 참여한 전 국방부 관리인 Colin Carroll은 2022년 12월 인터뷰 에서 다음과 같이 말했습니다.
[프로젝트 예산] Maven은 연간 2억 5,700만 달러, RDT&E [연구 개발 테스트 및 평가 기금]입니다. 그 중 많은 부분이 산업에 사용되었습니다. 아마도 그 중 1억 개가 DevSecOps 플랫폼 측에 있었을 것입니다. 따라서 데이터 수집, 데이터 큐레이션, 데이터 라벨링. 메이븐은 매년 400명의 데이터 라벨러로 구성된 팀을 8시간 교대 근무하며 모든 다른 플랫폼, 모든 다른 센서, 미분류, 분류된 GEOINT 데이터에 라벨을 붙였습니다. 원격으로 보기에도 부서에서 다른 프로그램은 없습니다.
Carroll은 Maven이 데이터 레이블링 파이프라인 및 데이터 레이블링 조직의 엔지니어링을 수행한 심각성 측면에서 DOD 이니셔티브 중 중요한 특이점이라고 정확하게 설명합니다. 그러나 데이터 레이블 지정 작업이 실제로 완료되지 않는다는 점을 이해하는 것도 중요합니다. 2017년부터 아프리카와 중동 에서 미군 작전을 지원하는 Project Maven의 작업 결과 Maven 조직은 수집하고 레이블을 지정했습니다.사막 환경과 해당 지역에서 흔히 볼 수 있는 차량 유형을 다루는 방대한 양의 원격 감지 데이터. 시스템이 해당 지역 및 환경 조건에서 유용한 성능을 제공할 수 있지만 동일한 AI 모델과 동일한 센서 플랫폼을 사용하더라도 다른 상황에서 Maven의 성공을 복제하려면 추가 작업이 필요합니다. Project Maven을 지원한 한 전 DOD 관리는 CSIS에 다음과 같이 말했습니다. 사막의 맑은 하늘, 높은 태양 조건에 적합한 레이블이 지정된 데이터 세트가 있지만 해당 AI 모델을 눈 덮인 풍경으로 가져가면 성능이 떨어집니다.”
그 이유를 이해하려면 AI 컴퓨터 비전 시스템의 한계를 설명하는 다음의 유명한 예를 살펴보십시오. 워싱턴 대학의 연구원들은 훈련을 받았습니다.주어진 이미지가 "늑대"인지 "허스키"인지 판단하는 AI 이미지 분류기. 그러나 AI 분류기는 동물의 특징이 아니라 이미지 배경에 눈이 있는지 여부에 따라 결정했습니다. 이 오류는 훈련 데이터 세트에서 늑대의 레이블이 지정된 모든 이미지의 배경에 눈이 있었지만 레이블이 지정된 허스키 이미지의 배경에는 눈이 없었기 때문에 발생했습니다. 훈련이 완료된 후 운영 AI 모델은 눈 덮인 배경에 있는 허스키 이미지를 "늑대"로, 눈이 아닌 배경에 있는 늑대 이미지를 "허스키"로 잘못 분류했습니다. 이 예에서 분명히 알 수 있듯이 AI 프로그램 관리자는 AI 개발의 훈련 단계에서 실제로 어떤 종류의 "학습"이 발생했는지 평가할 때 주의해야 합니다. 99 이상으로 보이는 것.
이러한 유형의 AI 실패 모드는 DOD 프로그램 관리자가 염두에 두어야 할 핵심 과제입니다. DOD는 전 세계적인 작전 요구 사항을 가지고 있으며, 수십 년 동안 평화로운 지역과 진정으로 전례 없는 작전 조건에서도 언제든지 전쟁이 발발할 수 있도록 준비해야 합니다. 위성 원격 감지 또는 소셜 미디어 게시물과 같은 일부 유형의 데이터는 평시에도 쉽게 수집할 수 있지만 다른 유형의 데이터는 전시에만 수집할 수 있습니다. 러시아 군 관계자들은 우크라이나가 북대서양조약기구(NATO)가 제공한 무기와 장비를 사용하는 것을 러시아의 미래 군사 AI 애플리케이션에 사용할 NATO 장비에 대한 작전 훈련 데이터를 수집할 수 있는 최고의 기회로 보고 있다고 명시적으로 밝혔습니다 .
전반적인 데이터 요구를 어느 정도 줄일 수 있는 다양한 AI 기술과 접근 방식이 있으며, 이는 지난 몇 년 동안 집중적으로 연구된 분야였습니다. 특히 전이 학습은 잠재적으로 AI가 동일한 유형(예: 이미지, 오디오)의 데이터를 사용하지만 다른 클래스(예: 얼굴, 자동차)를 포함하여 레이블이 지정된 전체 데이터 요구 사항을 줄이도록 할 수 있지만 이 글을 쓰는 시점에서 이것은 대상 클래스에서 많은 양의 레이블이 지정된 교육 데이터가 필요하지 않습니다. 또한 지난 3년 동안 자기 지도 학습 분야에서 중요한 진전이 있었으며 이 영역의 지속적인 발전으로 이미지 인식을 포함한 일부 응용 프로그램에 대한 기존 지도 학습과 비교하여 데이터 라벨링 요구 사항을 더욱 줄일 수 있습니다.. 그러나 지금까지 텍스트 또는 오디오 데이터와 비교하여 이미지 데이터 작업에서 진행 상황이 더 완만했으며 교육 데이터 세트의 상당한 다양성에 대한 전반적인 요구가 곧 변경될 것 같지 않습니다. 레이블이 지정된 데이터 요구 사항을 줄이기 위해 대부분의 경우 미숙하지만 또 다른 유망한 기술인 합성 데이터의 발전을 활용하는 과정에서도 마찬가지입니다.
지금까지 이 논문은 AI 컴퓨터 비전 애플리케이션의 예를 사용하여 AI 과제에 중점을 두었습니다. 그러나 데이터 문제는 물류 또는 인적 자원과 같은 사용 사례에서 똑같이 어렵고 때로는 더 어렵습니다. 한 전직 군인이 CSIS에 말했듯이 일부 DOD 유지 관리 팀은 여전히 펜과 종이 유지 관리 기록을 사용하는 반면 다른 팀은 서로 쉽게 호환되도록 설계되거나 그렇지 않을 수 있는 다양한 소프트웨어 기반 시스템을 사용합니다. 데이터가 많다고 해서 AI 훈련용 데이터셋으로 쉽게 활용되는 데이터가 많다는 것은 아니다. 데이터 문제를 해결하는 것은 일반적으로 모든 유형의 AI 지원 솔루션을 대규모로 적용하기 위한 전제 조건입니다.
요컨대, 데이터 레이블 지정 및 데이터 큐레이션을 위한 전략적 프로그래밍 복잡성은 다음과 같은 여러 영역에서 나타납니다.
이러한 모든 도전과 복잡성을 감안할 때 DOD CDAO(Chief Digital and Artificial Intelligence Office)의 책임자인 Craig Martell이 최근 인터뷰에서 DOD의 최우선 순위는 "고품질 데이터를 유도하는 것"이라고 말한 것은 놀라운 일이 아닙니다 . CDAO 사무소에 대한 그의 비전은 "부서에서 AI의 중앙 집중식 지원자로서 도구, 능력 및 컨설팅을 제공하여 레이블이 지정된 데이터를 구축하여 업계에 전달하고 그들이 구축할 수 있도록 하는 것이었습니다. 당신에게 적합한 모델입니다.”
AI 개발 노력을 담당하는 DOD의 한 고위 간부는 인터뷰에서 CSIS와의 인터뷰에서 "내가 시간을 보내는 가장 중요한 일은 DOD의 여러 부분과 업계 파트너 간의 데이터 권리 및 데이터 공유 계약을 협상하는 것"이라고 말했습니다.
이것은 전적으로 적절하고 놀라운 일이 아닙니다. DOD AI 프로그램 관리자는 이와 유사하게 데이터 관련 문제가 가장 복잡한 여러 문제에서 계속해서 발생할 것이라고 예상해야 합니다.
질문 3: 컴퓨팅 인프라 및 네트워크 액세스
AI 시스템이 개발 및 운영 사용에 필요한 모든 DOD 네트워크에 상주하고 상호 작용하도록 어떻게 승인받을 수 있습니까?
AI 지원 기능을 개발하고 운영하는 DOD의 주요 과제 중 하나는 DOD 디지털 네트워크의 다양성과 이러한 네트워크에서 데이터에 액세스하고 데이터를 이동하는 소프트웨어 시스템을 효과적으로 구축하는 데 장애가 되는 것입니다. 미 사이버 사령부(US Cyber Command)에 따르면 DODIN(Department of Defense Information Network)은 다음과 같이 구성되어 있습니다 .
이 거대한 DOD 네트워크 환경은 사이버 위협의 끊임없는 공격을 받고 있으므로 DOD는 네트워크의 사이버 보안을 최우선 순위로 확보하는 것을 고려합니다. 그 이점에도 불구하고 사이버 보안에 대한 현재 DOD 접근 방식은 소프트웨어 지원 시스템, 특히 AI 머신 러닝 기능을 활용하는 시스템을 개발, 운영 및 업데이트하려는 모든 DOD 조직에 엄청난 과제를 제시합니다. 특히 ATO(Authority to Operate)로 알려진 특정 DOD 네트워크에서 작동할 수 있는 특정 소프트웨어 시스템 권한을 부여하는 현재 프로세스는 AI 채택을 가속화하는 데 주요 장벽입니다.
DODIN에서 작동하고 정부 데이터를 처리하는 모든 소프트웨어 시스템은 인증된 DOD 권한 부여 공무원으로부터 공식 ATO를 받아야 합니다. ATO가 없으면 소프트웨어는 DODIN에서 합법적으로 작동할 수 없습니다. 기밀 또는 분류된 비밀 데이터와 같은 많은 유형의 데이터는 정부 네트워크에서 유출되는 것이 금지되어 있습니다. 기밀 데이터를 수신하고 사용할 권한이 있는 특정 방위 산업체 네트워크 의 경우에도 이러한 네트워크는 DOD CSSP의 권한에 속하며 ATO 요구 사항을 포함하여 DODIN에 연결하기 위한 실질적인 요구 사항을 충족해야 합니다.
ATO 프로세스는 해당 DOD 구성요소의 네트워크에 새로운 소프트웨어 시스템을 허용할 것을 제안하는 모든 조직이 소프트웨어가 관련 보안 수준(예: 기밀, 분류된 비밀, 분류된 최상위 비밀) 및 특정 DOD 조직 및 시스템에 적용되는 추가 통제. 대부분의 DOD 구성 요소에는 단 하나의해당 구성 요소 내의 모든 시스템을 승인하고 장래의 새로운 응용 프로그램을 허용할 때의 이점과 위험을 평가할 책임이 있는 권한을 부여합니다. 이 관리들은 시간에 대한 막대한 요구에 직면하고 있으며 그들의 인센티브는 일반적으로 극도의 위험 회피에 맞춰져 있습니다. 한 인터뷰 대상자는 권한을 부여하는 공무원으로서 ATO 요청에 "아니오"라고 잘못 말하는 것보다 "예"라고 잘못 대답하는 것이 경력을 손상시키는 것이 훨씬 더 쉽다고 CSIS에 말했습니다.
ATO 절차는 시간이 오래 걸립니다. 새로운 소프트웨어 또는 새로 업데이트된 소프트웨어의 경우 GSA(General Services Administration)의 전문가들은 정부 전체에서 ATO를 받는 데 일상적으로 6~18개월이 걸린다고 추정합니다 . 일부에서는 DOD AI 지원 애플리케이션의 경우 18개월 이상이 더 일반적이라고 주장합니다. ATO 프로세스를 시작하기 전에 소프트웨어 개발이 이미 완료되고 소프트웨어가 이전에 DODIN의 다른 부분에서 작동하도록 하나 이상의 ATO를 받은 경우에도 이 긴 기간이 종종 적용됩니다. [1]
실제로 이것은 DOD 프로그램 관리자가 AI 기능 개발 노력의 일환으로 DOD 데이터를 사용하려는 경우 개발 환경과 그 안에 있는 다양한 소프트웨어가 모두 제공될 때까지 해당 AI 기능 개발을 시작할 수 없음을 의미합니다. ATO. 상업 및 학술 부문(우크라이나 군대)에서 AI 개발자는 TensorFlow 또는 PyTorch와 같이 널리 사용되고 무료로 사용할 수 있는 오픈 소스 AI 개발 프레임워크를 쉽게 다운로드하고 해당 프레임워크에 데이터를 즉시 로드하여 AI 개발을 시작할 수 있습니다. 모델.
반대로 DOD 네트워크에 TensorFlow를 설치할 수 있는 권한을 확보하려면 ATO 프로세스를 탐색한 경험이 있는 전문가가 수개월 동안 작업해야 할 수 있습니다. 또한 향후 변경 사항이 ATO에서 합의한 조건을 잠재적으로 위반하는 것으로 간주되기 때문에 해당 ATO는 향후 소프트웨어 업데이트도 다루지 않을 가능성이 높습니다.
기존 ATO 프로세스는 신속하고 반복적인 데이터 기반 소프트웨어 개발에 강력한 장애물을 제공합니다. CSIS와의 대화에서 AI 개발 노력에 대한 수년간의 직접적인 경험을 가진 한 DOD 고위 지도자는 "ATO의 이러한 도전이 우리를 산 채로 먹고 있습니다."라고 말했습니다.
더욱이 점점 더 많은 국방부 지도자들이 ATO 프로세스가 사이버 보안을 제대로 보장하지 못한다는 결론에 도달하고 있습니다. 해군부 최고 정보 책임자인 Aaron Weis는 작년 인터뷰 에서 다음과 같이 말했습니다.
3년 ATO라는 생각은 잘못된 것입니다. 거대한 스프레드시트를 작성하고 팔굽혀펴기를 10,000번 하면 3년 동안 유효한 ATO를 받게 됩니다. . . 그러면 어떻게 됩니까? 향후 3년 동안 해당 시스템은 진화하거나 업데이트되지 않았습니다. 더 이상 보안이 유지되지 않고 결국 내 책상에 올라가는 고위험 에스컬레이션으로 끝납니다. . . . 나쁜 행동을 장려합니다.
ATO 장벽과 관련하여 AI 지원 기능을 개발하고 배포하려는 DOD 프로그램 관리자가 사용할 수 있는 몇 가지 옵션이 있습니다.
옵션 1: 계약자 소유 또는 계약자 운영 기능(일명 "서비스로서의 데이터")
DODIN에 데이터를 전송하는 데 대한 제한은 DODIN에 소프트웨어를 설치하거나 DODIN에서 상업용 인터넷으로 데이터를 이동하는 데 대한 제한보다 훨씬 적습니다. 이는 계약자가 센서를 소유하고 컴퓨팅 인프라를 소유하면 상업적 관행을 사용하여 비교적 빠르게 고급 AI 기능을 개발한 다음 해당 기능을 정부를 대신하여 운영할 수 있음을 의미합니다. 이 획득 모델에서 DOD는 AI 지원 소프트웨어 또는 하드웨어 기능을 개발하기 위해 회사에 비용을 지불하지 않습니다. 대신 데이터를 구매하고 있습니다.
이것은 이 백서의 앞부분에서 언급한 Maxar Technologies와 같은 상용 위성 원격 감지 회사의 주요 비즈니스 모델입니다. Maxar는 원격 감지 위성을 구축, 소유 및 운영하고 데이터를 미국 정부에 판매합니다. Maxar는 정부에 데이터를 제공하는 능력을 향상시키기 위해 AI 기능을 사용할지 여부와 사용 방법에 대해 스스로 결정하지만, 서비스의 유용성을 지속적으로 개선하기 위해 재정적으로 인센티브를 받습니다.
"서비스로서의 데이터" 모델의 또 다른 예는 무인 시스템과 AI를 5함대 작전에 신속하게 통합하기 위해 2021년 미 해군 중부 사령부(NAVCENT)가 설립한 태스크 포스인 태스크 포스 59에서 나옵니다. 태스크 포스 59는 반복적인 기술 개발과 5함대 해군 훈련 및 작전으로의 통합이라는 인상적인 주기를 달성했습니다. AI 지원 기능의 대부분은 "서비스로서의 데이터" 기반으로 조달되었습니다. 즉, 무인 및 자율 해상 드론을 포함한 많은 해군 센서가 미 해군이 아닌 Task Force 59의 산업 파트너가 소유하고 운영한다는 의미입니다. 또한 AI 알고리즘은 상용 클라우드 인프라에서 실행되었습니다. AI 사용의 이점을 포함하여 이러한 시스템에서 생성된 데이터는 단방향 전송 기반으로 DODIN으로 이동되었습니다.
Task Force 59의 경우 이 아키텍처는 ATO의 필요성을 없애고 전반적인 기술 개발 및 배포 속도를 빠르게 가속화했습니다. 그러나 이 모델의 주요 단점은 이러한 상용 시스템이 일반적으로 기밀 데이터 네트워크에서 작동하는 군 소유 자산과 직접 통합하는 능력에 심각한 제한이 있다는 것입니다. 이것의 의미는 후속 CSIS 논문에서 더 자세히 탐구될 것입니다.
옵션 2: 데이터 분류 해제를 모색합니다.
DOD AI 프로그램 관리자의 목표가 산업 파트너가 인프라에서 AI 개발을 담당하도록 하는 것이라면 문제의 데이터가 분류되지 않은 경우 훨씬 더 쉽습니다. 분류되지 않은 데이터를 계약자와 공유하는 데 훨씬 적은 제한이 있기 때문입니다. 앞에서 설명한 것처럼 데이터를 분류 해제하는 한 가지 방법은 계약자가 데이터의 원본 소스가 되도록 하는 것입니다. 그러나 DOD 인적 자원 데이터 또는 작전 사용 과정에서 DOD 무기 시스템에 의해 생성된 데이터와 같이 문제의 데이터가 본질적으로 정부 관련 데이터인 경우에는 불가능합니다.
DOD 무기 및 센서 시스템에서 생성된 데이터 중 일부는 본질적으로 기밀이지만 경우에 따라 데이터의 특정 부분만 분류되어야 하고 다른 부분은 그렇지 않은 경우도 있습니다. 이 경우 미분류 부분과 분류 부분을 분리하여 데이터 레이블링 및 AI 개발 조직에서 사용할 수 있도록 미분류 부분만 제공할 수 있습니다.
옵션 3: 지속적인 ATO를 추구하거나 ATO가 있는 DOD 조직과 협력
ATO 프로세스는 시간이 많이 소요될 뿐만 아니라 향후 소프트웨어 업데이트 기능에 심각한 제한을 가합니다. ATO는 소프트웨어의 현재 아키텍처 및 해당 소프트웨어에 대한 계획된 향후 수정 세트와 관련된 승인 프로세스입니다. 그러나 예상치 못한 문제나 운영 커뮤니티의 변화하는 요구로 인해 계획되지 않은 수정이 필요한 경우에는 어떻게 해야 할까요? 이러한 변경 사항은 ATO 준수를 위험에 빠뜨리고 프로그램이 긴 ATO 인증 프로세스를 처음부터 다시 시작하도록 할 수 있습니다. 소프트웨어 시스템에 변경 사항이 없더라도 대부분의 ATO는 3년 후에 만료되며 재승인을 받아야 합니다. 이 모든 것은 변경 사항이 사용자 경험을 개선하고 운영 효율성을 높이는 경우에도 소프트웨어 시스템을 크게 변경하지 않도록 프로그램 사무소에 인센티브를 제공합니다.
최근 DOD에서는 이러한 문제를 해결하는 데 도움이 될 수 있는 일반적으로 "연속 ATO"(cATO)라고 하는 접근 방식을 추구하려는 추진력이 생겼습니다. DOD 프로그램의 경우 cATO 접근 방식은 초기 ATO를 확보하는 데 필요한 6~18개월을 단축하지는 않지만 소프트웨어 업데이트를 배포하는 데 필요한 시간과 이 작업의 복잡성을 크게 줄입니다. 일반적으로 이는 cATO 계획이 모든 소프트웨어 업데이트가 개발될 승인된 조건 및 제한 사항뿐만 아니라 상업용 인프라에서 소프트웨어 업데이트를 배포하기 전에 소프트웨어 업데이트를 평가할 자동화된 테스트 스위트 및 내부 검토 프로세스를 설정하기 때문입니다. DODIN 또는 DODIN의 한 부분에서 다른 부분으로.
2022년 2월, 당시 DOD의 고위 정보 보안 책임자인 David McKeown은 DOD 시스템이 cATO 상태에서 작동하기 위한 승인을 얻을 수 있는 방법에 대한 지침을 제공하는 메모에 서명 했습니다. 특히 "국방부 CISO(최고 정보 보안 책임자)가 승인한 cATO에는 만료 날짜가 없으며 필요한 실시간 위험 상태가 유지되는 한 계속 유효합니다."라는 언급이 특히 주목됩니다. cATO를 달성하기 위해 해당 메모에 명시된 두 가지 주요 요구 사항은 시스템이 DOD 엔터프라이즈 DevSecOps 전략을 수용하고 승인된 DevSecOps 참조 설계 에 맞춰 조정되었음을 입증하는 것입니다 .
이미 유연한 cATO가 있는 DOD 네트워크 환경에서 AI 개발 프로세스를 실행하거나 cATO가 있는 조직과 협력할 수 있는 프로그램은 거의 즉시 개발을 시작할 수 있기 때문에 특권적인 위치에 있습니다. 이러한 종류의 유연성이 있는 DOD 개발 환경의 예는 다음과 같습니다.
지금까지 본 논문은 주로 AI 개발 프로세스를 위한 ATO에 초점을 맞추었다. 그러나 대부분의 DOD 소프트웨어 시스템은 시스템이 작동하는 네트워크와 다른 네트워크(및 다른 권한 부여 공무원의 권한 하에)에서 개발됩니다. 예를 들어 드론 감시 항공기용 소프트웨어는 미국의 공군 프로그램 사무소 네트워크에서 개발될 수 있지만 여러 전투 사령부의 네트워크에서 운영적으로 배포될 가능성이 높습니다. 즉, cATO가 전투기 능력 향상 속도에 진정으로 차이를 만들려면 AI 시스템에 개발 및 배치 네트워크 모두에서 작동할 수 있는 권한을 제공해야 합니다.
질문 4: 기술적인 재능
올바른 유형의 AI 인재를 충분히 유치하고 그 재능을 잘 활용하려면 어떻게 해야 할까요?
숙련된 AI 인재를 채용하는 것은 오늘날 모든 곳에서 어렵지만 정부에서는 특히 어렵습니다. AI 전문가는 상대적으로 적다. 최근 현장 보고서에 따르면 2021년에는 2000명 미만의 새로운 컴퓨터 과학 박사 학위 졸업생이 있었고 그 중 0.7% 미만이 정부에 진출했습니다.
선도적인 AI 개발자를 위한 상업 부문의 급여는 DOD와 비교할 수 없습니다. AI 관련 기술을 갖춘 새로 발행된 컴퓨터 과학 박사의 급여는 연간 $300,000에서 $500,000인 것으로 알려 졌습니다 .
DOD의 모든 AI 전문가가 박사 학위를 가질 필요는 없으며 모든 AI 전문가가 전적으로 돈에 동기를 부여하는 것은 아닙니다. 그래도 전반적인 문제는 중요합니다. 인공지능 국가안보위원회(National Security Commission on Artificial Intelligence)는 최종 보고서 에서 "인재 부족은 정부의 가장 눈에 띄는 AI 부족이며 국가 안보 목적을 위해 AI 지원 기술을 구매, 구축 및 배치하는 데 가장 큰 단일 방해물"이라고 밝혔습니다.
정부의 AI 인재 풀 개선에 관한 DOD의 최근 관심은 DOD가 AI 인재와 관련된 특별 채용 권한을 갖도록 하는 데 집중되었습니다. 그러나 민감성 때문에 자주 논의되지 않는 추가 과제가 있습니다. 바로 정부에서 근무하는 소수의 소중한 AI 전문가의 귀중한 시간이 낭비되지 않도록 하는 것입니다. 너무 자주 그렇습니다.
이 프로젝트의 이해 관계자를 인터뷰하는 과정에서 CSIS는 DOD AI 인재 관리 부실의 많은 골칫거리 사례를 알게 되었습니다. 몇 가지 예시는 다음과 같습니다.
이러한 문제는 모두 이 백서의 앞부분에서 강조한 데이터 및 네트워크 액세스 문제로 인해 더욱 복잡해집니다. 정부 서비스에 대한 가장 큰 매력이 의미 있는 문제를 해결할 수 있는 기회인 경쟁적인 인재 환경에서 이러한 문제는 AI 전문가가 DOD와의 싸움을 도울 수 있는 기능을 개발하기 위해 전문 지식을 사용하는 대신 관료주의에 맞서 싸우는 데 시간을 할애한다는 것을 의미할 수 있습니다. 그리고 승리.
위의 인재 문제는 특히 DOD 프로그램 관리자 책임의 일부인 AI 인재를 DOD 민간 인력으로 채용하는 어려움을 나타냅니다. 2022년에 DOD는 DOD 사이버 인력 프레임워크를 활용하여 AI 및 데이터 관련 작업 역할을 위한 새로운 작업 코드 세트를 만들었습니다.. 이것은 최소한 DOD 조직이 다가오는 예산 요청에서 이러한 역할을 가진 개인을 고용할 수 있는 권한을 포함하는 것을 더 쉽게 만듭니다. 그러나 특히 군대에서 AI 인재의 파이프라인은 초기 단계에 있습니다. 각 병역에는 필요한 수의 조종사, 통신 전문가, 원자력 엔지니어 등을 모집하고 훈련시키는 시스템이 있습니다. 이러한 각 전문 분야에 대한 작업 코드와 조직의 인재 파이프라인이 있습니다. 데이터, AI 및 소프트웨어 개발을 위한 동등한 군사 인재 개발 파이프라인은 아직 구축 및 구현의 초기 단계에 있습니다.
이러한 인재 부족과 잘못된 인재 관리의 결과는 막대하며, 이는 DOD가 대부분의 AI 관련 기술 작업을 계속해서 산업계에 아웃소싱하는 경우에도 마찬가지입니다. 한 군사 AI 프로그램 관리자는 CSIS에 "산업계에 올바른 질문을 할 수 있는 적절한 전문성을 갖춘 정부 직원은 거의 모두 산업계로 일하러 가고 있습니다."라고 말했습니다.
질문 5: 최종 사용자 피드백
운영 사용자 커뮤니티가 개발 프로세스 중에 빈번한 피드백 및 통찰력의 출처가 되도록 어떻게 보장할 것입니까?
국가 안보에 영향을 미치기 위해서는 군사 AI 기능이 두 커뮤니티, 즉 일반적으로 전투 사령부를 의미하는 작전 전투원과 DOD 프로그램 관리 직원 및 업계 파트너를 모두 포함하는 기능 개발 커뮤니티 간의 긴밀한 협력을 통해 개발되어야 합니다. 이 두 커뮤니티 간의 협력을 보장하기 위한 전통적인 DOD 관료적 메커니즘은 요구 프로세스와 획득 프로세스입니다. 요구 프로세스는 합동 참모에서 관리하며, 전투원 지휘 요구를 수용하고 이를 능력 요구로 전환하는 데 가장 영향력 있는 프로세스는 합동 능력 통합 및 개발 시스템 입니다.(JCIDS). 이 수십 년 된 시스템에는 장점이 있습니다. 특정 종류의 기술적 상호 운용성(특히 하드웨어에서)을 추진하고, 불필요한 노력의 중복을 방지하고, 획득 프로세스의 공정성을 높이고, 어떤 작업을 수행해야 하는지, DOD에서 누가 그 일을 담당하는지에 대한 DOD 전체의 명확성을 제공하는 데 유용합니다. .
동시에 JCIDS는 특히 AI 및 데이터 기반 소프트웨어 개발의 경우 개발자가 필요로 하는 운영 사용자의 통찰력 중 일부만 제공하는 느리고 너무 자주 융통성이 없는 시스템입니다. 올바르게 수행된 AI 개발은 각 반복 주기가 테스터 및 운영 사용자로부터 새로운 피드백을 받는 반복 프로세스입니다.
소수의 정부 연구 커뮤니티를 제외하면 기계 학습 AI는 여전히 DOD의 비교적 새로운 작업이며 AI가 할 수 있는 것과 할 수 없는 것에 대한 명확한 이해가 아직 DOD 직원 사이에 널리 퍼져 있지 않습니다. 또한 AI의 기술 발전은 매우 빠르고 가속화되고 있습니다. 원하는 기능에 대한 요구 사항이 정확하게 설정되고 몇 년 동안 개발되는 동안 고정된 상태로 유지된다는 생각에 기반한 요구 사항 설정 프로세스는 완전히 비현실적입니다.
DOD AI 프로그램 관리 경험이 있는 여러 CSIS 인터뷰 대상자는 중요한 시스템 요구 사항이 JCIDS 요구 사항이 확정된 후뿐만 아니라 업계 파트너에게 계약이 수여된 후 오랜 시간이 지난 후에도 너무 늦게 발견되는 것이 일반적이라고 말했습니다. JCIDS 단계와 계약 언어 모두에서 요구 사항은 DOD 조직 학습이 발생할 수 있도록 충분히 유연해야 하며 학습은 운영 커뮤니티와 개발 커뮤니티 간의 파트너십이어야 합니다. 전자는 AI가 임무에 어떻게 영향을 미칠 수 있는지 알아야 하고, 후자는 임무 요구 사항과 제안된 기능이 전투 커뮤니티의 운영 현실에 어떻게 부합하는지 알아야 합니다.
DOD 및 민간 부문의 구성원은 모두 AI 도구를 개발할 때 사용자 참여 문제가 있다고 언급했습니다. 이것은 여러 가지 이유 때문입니다. 첫째, 시스템을 개발하는 사람들은 종종 시스템 사용자와 대화할 기회가 거의 없습니다. DOD의 전 회원은 계약업체가 종종 사용자와 간략하게 이야기하고 도구를 구축하기 위해 떠났고 몇 달 또는 몇 년 후에 실제로 고객의 요구에 맞지 않는 솔루션을 가지고 돌아온다고 언급했습니다. 사용자는 종종 바쁘기 때문에 개발 지원을 이미 과중한 워크로드에 대한 추가 작업으로 간주하여 공동 작업을 방해할 수 있습니다. 현재 DOD 리더와 계약자 모두 운영 커뮤니티가 개발자가 사용할 수 있는 언어로 요구 사항을 전달하는 것이 어려울 수 있다고 강조했습니다.
이미 논의한 바와 같이 AI의 기반인 반복은 최상의 결과를 보장하는 데 필요할 수 있습니다. 이러한 반복에는 개발자와 최종 사용자가 참여하는 방식의 변화와 이러한 참여를 감독하는 구조의 변화가 필요합니다.
개발자와 최종 사용자 커뮤니티 간의 긴밀한 연결을 보장하기 위해 DOD AI 개발 노력은 실제 통합 연습 과 연결되어야 합니다 . DOD 비즈니스 엔터프라이즈 활동이 아닌 전투 활동과 관련된 모든 기능의 경우 통합 훈련에는 하나 이상의 전투 사령부가 참여해야 합니다. 한 DOD 임원은 인터뷰에서 CSIS에 "전투사령부 중심이 아닌 모든 [AI 역량 프로그램 관리 모델]은 정당화하기 어렵다"며 "일반적으로 기술의 경우 가장 좋은 방법은 가능한 한 빨리 사용자.”
질문 6: 예산 책정 및 전환
AI 기능과 관련된 다양한 DOD 개발, 조달 및 운영 조직이 프로그램 참여를 위해 적절하게 예산을 책정하고 있습니까?
국방부는 그 규모를 완전히 파악하기가 엄청나게 어려운 대규모 조직입니다. 2022년 DOD 예산은 7,560억 달러 이상으로 미국 국내 총생산(GDP)의 약 3% 에 해당합니다. 현역 군인과 정부 민간인만 포함해도 DOD는 200만 명 이상을 고용하고 있습니다 . 이러한 엄청난 규모에서 정치 지도자들이 노력의 낭비적인 중복을 피하고 자원의 효과적이고 효율적인 사용에 대한 책임을 제공하기 위해 DOD 조직이 명확한 역할과 책임을 전문화하기를 바라는 것은 당연합니다.
PPBE (Planning, Programming, Budgeting & Execution Process ) 라고 하는 DOD 자원 할당 시스템은 민주적으로 선출된 대표가 국방 지출에 대한 통제권을 유지하고 충당된 자금이 낭비 없이 그들의 의도된 목적. 또한 기술 및 조직적 우수성을 달성하기 어렵고 다년간의 공백이 있는 경우 손실되기 쉬운 핵잠수함과 같은 매우 복잡한 군사 능력의 개발 및 유지에 있어 안정성을 측정하도록 설계되었습니다. 펀딩 중. 이것은 거의 모든 군인이 적어도 몇 년마다 임무를 변경하는 군대에서 작은 문제가 아닙니다.
일반적으로 현재 시스템은 이러한 핵심 목표를 달성하는 데 상당히 좋은 역할을 하지만 많은 단점도 가지고 있습니다. 그 중 중요한 것은 느리고 융통성이 없으며 보다 자연스럽게 그룹화될 많은 활동을 분리해야 한다는 사실입니다. 함께. DOD PPBE 프로세스의 아키텍처는 AI 채택에 많은 영향을 미치지만 이 문서에서는 예산 책정 및 전환과 관련된 두 가지 주요 과제에 중점을 둘 것입니다.
기술 시스템 개발의 경우, 이 구분은 세 개의 광범위한 커뮤니티로 요약될 수 있습니다(간결함을 위해 약간의 지나친 단순화 및 생략 포함).
개발 단계에서 확장된 생산 단계로 전환하고 생산된 항목을 운영 커뮤니티로 물리적으로 이전하는 것은 모두 조직의 책임과 일치할 수 있는 자연스러운 프로세스 포인트이기 때문에 이 부서는 하드웨어 기술에 대해 합리적으로 잘 작동합니다. 또한 고위 예산 결정권자에게 (오해의 소지가 있기는 하지만) 단순성을 측정할 수 있는 방법을 제공합니다. 예를 들어 기술 현대화를 가속화하려면 첨단 기술을 연구하는 연구 개발 조직에 더 많은 자금을 지원하기만 하면 됩니다.
그러나 이 하드웨어 중심 조직 모델은 소프트웨어 중심 개발 및 운영, 특히 AI의 현실을 수용하는 데 어려움을 겪고 있습니다. 국방혁신위원회(Defense Innovation Board)는 기억에 남을만한 2019년 연구 제목을 " 소프트웨어는 결코 끝나지 않는다(Software Is Never Done )"라고 명명했으며 이 짧은 문구에는 많은 지혜가 담겨 있습니다. 자동차 제조 와 같은 전통적으로 하드웨어 중심의 산업에서도 소프트웨어는 점점 더 경쟁 우위의 초점이 되고 있습니다. 신차는 데이터(AI 모델 교육에 사용되는 데이터 포함)를 무선으로 제조업체에 다시 전송하고 자동차 제조업체는 판매 후 수십 년 동안 새로운 기능을 제공하는 소프트웨어 업데이트를 자동차에 계속 공급합니다.
DOD의 경우 소프트웨어 연구 및 개발, 조달 및 운영이 두 시간 측면에서 더 밀접하게 연결되는 경우가 많기 때문에(선도적인 기술 회사는 종종 새로 발표된 AI 연구 결과를 몇 주 만 에 고객 대면 제품에 통합 ) 및 조직적 책임(고객 대면 소프트웨어 플랫폼을 유지하고 운영하는 조직도 개발 및 확장된 배포에 깊이 관여함). Tesla와 같은 일부 경우에는 고객 대면 소프트웨어 개발자가 보다 근본적인 연구에 많이 관여합니다.
일반적으로 DevSecOps라고 하는 이 모델을 다양한 수준의 성공으로 복제하려고 시도하는 DOD의 일부가 있습니다. 아마도 가장 유명한 예는 미 공군 내의 케셀 런(Kessel Run) 조직일 것입니다. 그러나 CSIS가 인터뷰한 DOD 관계자는 소프트웨어 개발과 운영을 융합하는 DevSecOps 유형의 접근 방식을 구현하려는 자체 시도가 DOD 내에서 다른 조직의 책임에 대한 부적절한 침해로 간주되는 경우가 많았으며 상당한 관료적 저항에 직면했다고 밝혔습니다.
이것은 돈의 색깔인 DOD 예산 책정 프로세스의 두 번째 문제로 이어집니다. DOD 자금은 여러 세출 범주로 나뉘며 한 범주의 자금을 다른 목적으로 사용하는 것은 일반적으로 불법입니다. 예를 들어, DOD 조직은 새로운 시설의 목적이 연구 개발 또는 지원과 직접 관련이 있더라도 RDT&E 자금 또는 조달 자금을 사용하여 주요 신규 시설 건설을 수행할 수 없습니다. 이러한 시설은 군사 건설(MILCON) 달러로 자금을 조달해야 합니다. 조달 시스템.
전투 사령부와 같은 일부 유형의 조직은 일반적으로 RDT&E 자금이 없습니다. 이것은 NAVCENT의 일부인 미 해군의 태스크 포스 59가 계약자 소유, 계약자 운영 또는 "서비스로서의 데이터" 획득 모델에 따라 거의 모든 노력을 구조화한 이유 중 하나입니다. Task Force 59는 운영 및 유지 관리(O&M) 자금으로 거의 독점적으로 자금을 지원받으며, 이러한 자금은 일반적으로 연구 개발 자금으로 사용할 수 없지만 합법적으로 데이터 서비스를 구매하는 데 사용할 수 있습니다. 그러나 실제로는 90일마다 열리는 Task Force 59의 운영 기술 통합 해양 훈련을 지원하는 회사는 매우 빠른 속도의 연구 개발에 참여하고 있습니다. 태스크 포스 59에 대해 직접적으로 알고 있는 한 국방부 관계자는 훈련 사이에 다음과 같이 말했습니다. 관련 회사는 "매월 하드웨어를 변경하고 매주 소프트웨어를 변경"했습니다. 태스크 포스 59 훈련 동안 회사는 실제 전투 지휘 전투원이 시스템을 테스트하는 것을 보게 되었고, 개발 속도는 "하드웨어는 일주일 안에 변경되고 소프트웨어는 하루에 또는 때로는 하루에 여러 번 변경됩니다. ” CSIS와의 인터뷰에서 관련된 회사 중 한 임원은 "Task Force 59는 내가 본 어떤 DOD R&D 프로그램보다 더 열심히 그리고 더 빠르게 움직이도록 우리를 밀어붙였습니다."라고 말했습니다. 소프트웨어는 하루에 또는 때로는 하루에 여러 번 변경됩니다.” CSIS와의 인터뷰에서 관련된 회사 중 한 임원은 "Task Force 59는 내가 본 어떤 DOD R&D 프로그램보다 더 열심히 그리고 더 빠르게 움직이도록 우리를 밀어붙였습니다."라고 말했습니다. 소프트웨어는 하루에 또는 때로는 하루에 여러 번 변경됩니다.” CSIS와의 인터뷰에서 관련된 회사 중 한 임원은 "Task Force 59는 내가 본 어떤 DOD R&D 프로그램보다 더 열심히 그리고 더 빠르게 움직이도록 우리를 밀어붙였습니다."라고 말했습니다.
즉, DOD 예산 책정 및 요구 사항 설정 프로세스는 현재 DOD 또는 NAVCENT 내에서 Task Force 59의 성공을 확장하고 전환하는 데 주요 과제를 제기합니다. 계약자가 소유하고 계약자가 운영하는 모델이 적절하지 않은 본질적으로 정부 기능과 관련된 많은 DOD AI 사용 사례가 있습니다. 더욱이 전투 사령부는 대규모 기술 시스템 조달에 대한 책임이 없으며, 이는 일반적으로 군 서비스 및 일부 국방부 차원의 기관에 있습니다. 필요한 RDT&E 및 조달 자금을 보유할 수 있는 해군 프로그램 사무소는 Task Force 59의 연습 결과로 개발된 시스템 구매를 시작하기 위해 설립되지 않았습니다.
그러한 프로그램 사무소를 만들거나 이 작업을 수행하기 위해 기존 프로그램 사무소의 계획을 수정하는 것조차 DOD 요구 사항 설정 및 PPBE 프로세스를 거쳐야 하며, 이는 대부분 수년이 걸릴 것입니다. 개발 성공과 국방부 전체의 기술 확장을 위한 자금 조달 사이의 다년간의 격차는 태스크 포스 59를 지원한 기술 회사에게 중요한 과제입니다. 모든 기술 회사는 성장에 투자하여 국방 또는 상업 고객을 지원할지 여부를 결정해야 합니다. 전투원들이 좋아하는 입증된 능력을 생산하는 것이 회사의 투자에 대한 금전적 수익을 제공할 미래의 대규모 구매를 보장하지 않는다는 사실은 국방부와 협력하는 데 상당한 의욕을 꺾는 요인입니다.
CSIS는 연간 매출이 수십억 달러에 달하는 고도로 다각화된 주요 AI 기술 회사의 미국 CEO와 이야기를 나눴습니다. CEO는 직원들에게 국방부 고객과 일하지 말라고 구체적으로 지시하면서 “나는 이 나라를 사랑하고 국가 안보에 관심이 있지만 국방부가 원하는 것을 정확히 제공하더라도 결코 돈을 벌지 못한다. ” CEO는 또한 DOD 계약과 수익을 추구하는 것이 자연스럽게 DOD의 관료적 구조를 수용하도록 회사가 발전할 것이라고 느꼈다고 말했습니다. "저는 [우리 회사]가 DOD 관료적 미로를 탐색하는 데 세계 최고가 아니라 AI 기술을 구축하고 확장하는 데 세계 최고가 되기를 원합니다."
DOD는 이러한 문제 중 적어도 일부를 해결하기 위해 노력하고 있습니다. 돈의 색깔 문제와 관련하여 2020년 DOD는 소프트웨어 및 디지털 기술에 대한 새로운 예산 활동 범주(돈의 색깔)를 시작했습니다. 이것은 보다 유연하고 이전에 언급된 문제 중 일부를 해결하기 위한 것입니다. 의회는 초기 파일럿 프로젝트에 참여할 16개 프로그램을 승인했습니다. 그러나 의회는 승인하지 않았다.FY 2022 및 FY 2023 예산 요청에서 제안된 모든 후속 파일럿. 의회, 특히 상원 국방 세출 소위원회는 자금이 어떻게 사용되는지, 추가 자금 조달 유연성이 프로그램 관리 효율성에 어떤 영향을 미치는지에 대한 보다 자세한 데이터를 사용할 수 있을 때까지 파일럿 프로그램을 확장하는 것에 대해 우려를 표명했습니다. 이 경고는 의미는 좋지만 한 푼도 아깝고 어리석은 것입니다. 새로운 기금 시스템에 대한 의회 감독의 결점으로 인해 손실되는 것보다 훨씬 더 많은 납세자의 돈이 기존 PPBE 시스템의 비효율로 인해 손실되고 있습니다.
따라서 대부분의 DOD AI 프로그램 관리자는 소프트웨어 파일럿에서 생성된 고유한 예산 권한을 곧 받을 가능성이 낮습니다. 즉, 프로그램이 전투원의 필요에 진정한 영향을 미치려면 자체 예산 요청을 적절하게 계획, 실행 및 방어하는 것 이상에 관심을 기울여야 합니다. 그들은 또한 AI 프로그램에서의 역할에 대해 예산을 책정해야 하는 DOD의 다른 부분을 식별하기 위해 노력해야 합니다. AI 프로그램이 기술을 개발 중이고 현재 DOD 프로그램 사무소에 명시적으로 정렬되지 않은 경우 프로그램 사무소 또는 DOD 기관은 개발된 기능을 확장하기 위해 예산을 책정해야 하며 최종 사용자 커뮤니티는 적절한 지원을 받아야 합니다. 개발된 기능을 채택하고 구현하기 위한 인프라 및 훈련된 직원.
결론
DOD는 AI와 자율 기술이 미래의 전쟁과 미국 군사력에서 수행할 엄청난 역할을 오랫동안 인식하고 분명히 밝혔습니다. 여러 대통령 행정부에 걸쳐 있는 여러 국방부 장관들은 AI와 자율 시스템이 DOD의 최고 기술 현대화 우선 순위 중 하나라고 밝혔습니다. 그러나 DOD는 AI 및 AI 지원 기술의 채택을 늦추는 여러 가지 문제에 직면하여 미래가 다가옴에 따라 뒤쳐질 위험이 있습니다. 이러한 문제 중 일부는 AI 및 자율 시스템 기술의 현재 상태에 내재되어 있지만 지금까지 가장 중요한 장벽은 고유한 DOD 컨텍스트와 관련이 있습니다.
이 백서는 DOD 프로그램 관리 리더십의 관점에서 임무, 데이터, 컴퓨팅 인프라, 기술 인재, 최종 사용자 피드백 및 예산과 같은 가장 중요한 6가지 과제를 분석했습니다. 정부와 업계 파트너 간의 계약이 정부의 이익을 적절하게 보호하도록 보장하는 방법과 주어진 AI 기능은 전체 운영 용도에서 의도한 대로 작동하지만 이는 이 백서의 범위를 벗어납니다.
위에서 식별된 6가지 장벽은 다른 기술에 대해 존재했으며 부서는 이전에 일부 문제를 해결하려고 시도했지만 결과는 엇갈렸습니다. 이 CSIS 시리즈의 다음 문서에서는 이러한 장애물을 극복하고 DOD에서 AI 및 자율 시스템 채택을 가속화하기 위한 구체적인 권장 사항을 제공할 것입니다.
국방부에서 AI 지원 기능을 개발하고 배치하는 것은 어렵습니다. 이 백서에서 논의된 6가지 과제 중 하나라도 AI 프로그램이 목표를 달성하는 것을 방해하기에 충분합니다. 의회, 언론 및 DOD의 이해관계자들은 단일 AI 또는 자율 프로그램이 고군분투하는 것을 지켜보고 이러한 기술 혁신의 실행 가능성 또는 바람직함에 대해 시사하는 바를 추론할 때 주의를 기울여야 합니다.
성공의 길에는 많은 실패가 있을 것입니다.
Gregory C. Allen은 워싱턴 DC에 있는 전략 및 국제 연구 센터의 Wadhwani AI 및 첨단 기술 센터 책임자입니다.
이 보고서는 Applied Intuition의 아낌없는 지원을 통해 가능했습니다.
각주는 PDF를 참조하십시오.
이 보고서는 국제 공공 정책 문제에 초점을 맞춘 비과세 민간 기관인 CSIS(Center for Strategic and International Studies)에서 작성했습니다. 그 연구는 당파적이지 않고 비독점적입니다. CSIS는 특정한 정책적 입장을 취하지 않습니다. 따라서 이 간행물에 표현된 모든 견해, 입장 및 결론은 전적으로 저자(들)의 것으로 이해되어야 합니다.
© 2023 전략 및 국제 연구 센터. 판권 소유.
|