‘ChatGPT와 Gemini에 지지 마!’라고 외치는 사람들이 모르는 사실 / 2월 9일(월) / 다이아몬드 온라인
소프트뱅크 등 일본 기업 수십 곳이 투자해 국산 AI 개발에 나서는 움직임이 있지만, 정부는 이에 1조 엔 규모의 지원을 계획하고 있다고 한다. 그 행방을 점치는 데 있어, 국립정보학연구소 교수인 저자가 제시한 현황 분석은 시사점이 풍부하다. ChatGPT나 Gemini와 동등한 것을 일본이 만들기는 이제 불가능한 상황이지만, 그래도 취해야 할 방법은 많이 있다고 한다. ※본 글은 국립정보학연구소·정보사회상관연구계 교수 사토 이치로의 『2030 차세대 AI 일본의 승리 전략』(일경BP) 중 일부를 발췌·편집한 것입니다.
● 일본은 언어 생성 AI 외의 AI 개발을 해야 했다
ChatGPT가 화제가 된 2023년 이후, 언론은 매일같이 언어 생성 AI를 다루며 “일본도 따라잡아야 한다”는 논조를 반복했습니다. 게다가 정치적 의향도 겹쳐, 정부는 국산 LLM 개발 촉진에 나섰습니다.
하지만 대규모 언어 모델(LLM) 기반 언어 생성 AI를 지속적으로 개발하려면, 고급 전문 인력은 물론 학습 모델 구축을 위해 대량의 고성능 GPU를 활용한 대규모·장시간 계산이 가능한 자금력이 필요합니다.
또한, 생성 AI를 서비스로 제공할 때도 생성 처리 1회당 계산량은 학습 모델을 구축할 때보다 적지만, 처리 횟수가 많아 전체 계산량은 여전히 방대합니다. 따라서 지속적인 운용에도 자금력이 필요합니다. 일본 기업, 특히 AI 스타트업에게 LLM 개발은 소모전이 될 수 있습니다.
일본의 자금력과 인재를 고려하면, 언어 생성 AI 외의 AI 개발로 유도했어야 한다고 말할 수 있습니다. 언어 생성 AI 외의 AI 중에는 이미지 인식이나 음성 인식 등 산업 적용이 기대되고, 수익성도 높은 기술이 많았을 것입니다.
● 대규모 언어 모델의 국산 개발 전망은?
2023년 이후, 정부는 AI 개발 촉진 정책의 일환으로 LLM 개발 프로젝트에 예산 지원을 시작했으며, 언어 생성 AI 외의 AI 개발을 진행하던 여러 기업이 새롭게 LLM 개발 프로젝트를 시작한다는 의사를 밝혔습니다. 다만, LLM을 구축하려면 풍부한 계산 능력이 필요합니다.
예를 들어 고성능 GPU를 1,000대, 20일 동안 빌린다면, 하루당 임대료를 1만~2만 엔으로 잡을 경우 구축 비용이 2억~4억 엔에 달하고, 재구축을 반복하는 것은 피할 수 없을 것입니다. 만약 보유 자금 10억 엔 규모의 AI 스타트업이 LLM 개발에 진출한다면, 재무적으로 어떤 일이 일어날지는 쉽게 짐작할 수 있을 것입니다. 정부가 국산 대규모 언어 모델 개발을 지원한 것이 일본의 AI 개발 촉진에 기여했는지는 앞으로 검증이 필요합니다.
다만, LLM을 개발한다고 해서 ChatGPT나 Gemini와 동등한 것을 만들 수 있는 것은 아닙니다. 언어 생성 AI는 웹상의 문서를 학습시켜 모델을 구축하지만, 그 단계에서는 설명적인 문장 등 생성 가능한 문장의 종류가 제한됩니다.
반면, ChatGPT나 Gemini처럼 대화·요약·번역 등 다양한 작업을 수행하려면, 대화라면 예시 문장, 요약이라면 원문과 요약문 등을 추가로 학습시켜야 합니다. 다만, 그 예문을 만들기 위해 AI 기술을 활용한다 하더라도, 많은 인원을 동원한 작업이 필수적입니다.
국산 LLM 개발 프로젝트 대부분은 웹상의 문서를 학습시킨 단계에 머물러 있습니다. 따라서 기본적인 문장 생성에 대한 벤치마크에서 좋은 성과를 보여도, 다양한 작업에 대응할 수 있다는 보장은 없습니다.
● LLM에서 이길 수 없다면 상품화하면 된다
ChatGPT와 Gemini를 대표로 하는 LLM 기반 언어 생성 AI는 텍스트 생성 정확도가 높을 뿐만 아니라 범용성이 뛰어난 것이 특징입니다. 즉, 단순한 문서 작성은 물론 다양한 작업에도 대응할 수 있는 범용성을 갖추고 있어 앞으로도 널리 활용될 것으로 예상됩니다. 하지만 앞서 언급했듯이 일본은 이를 개발·운용할 충분한 자본력이 없다고 할 수 있습니다.
따라서 LLM 기반 언어 생성 AI는 해외에서 조달·활용하는 것을 전제로 할 수밖에 없을 것입니다. 그 대신 다음 세 가지를 진행해야 합니다.
(1) 일정 수준 이상의 품질을 갖춘 언어 생성 AI를 상품화한다
(2) 소규모 학습 모델 및 특정 도메인용 언어 생성 AI 개발을 지속한다
(3) LLM 기반 언어 생성 AI는 기술 감시를 위한 학술 연구 프로젝트에 남겨 둔다
여기서는 (1)에 대해 설명합니다. LLM 기반 언어 생성 AI는 일정 수준 이상의 품질을 언제든지 저렴하게 확보할 수 있게 하여, 이른바 상품화함으로써 자국에서 보유하지 않음으로 인한 불이익을 최소화해야 합니다.
이를 위해서는 여러 언어의 생성 AI를 활용할 수 있도록 유도해야 합니다. 예를 들어, 기업과 정부의 조달에서 특정 언어 생성 AI에 의존하는 것을 피하고, 경쟁법 등을 활용해 특정 생성 AI의 과점화를 방지해야 할 것입니다.
● 세 가지 표준·기준을 정함으로써 언어 생성 AI를 표준화하라
그리고 [도표 6‑1]에 제시된 것과 같은 세 가지 표준·기준을 정함으로써, 언어 생성 AI를 활용하는 방법과 제공되는 기능·품질을 표준화합니다. 이 표준화 준수를 LLM 기반 언어 생성 AI 사업자뿐만 아니라 소규모 학습 모델 기반 언어 생성 AI 사업자에게도 요구합니다.
즉, 언어 생성 AI를 저비용이면서 손쉽게 전환할 수 있게 하는 것입니다. 이는 안보 관점뿐 아니라 경제적으로도 다중 언어 생성 AI를 경쟁하게 하여 이용료의 높은 가격을 유지하는 데 중요한 역할을 합니다.
물론, 언어 생성 AI 사업자에게 이러한 표준화 준수를 요구하는 일은 쉽지 않습니다. 하지만 일본 이외의 국가, 예를 들어 유럽 등에도 언어 생성 AI의 상품화가 가져다 주는 이점이 있을 것입니다. EU를 포함한 여러 국가가 협력해 사업자에게 기준을 요구하는 것이 현명할 것입니다(※1).
※1 다른 회사의 언어 생성 AI를 사용하고 있는 기업, 예를 들어 대형 플랫폼 기업인 애플 등에도 이점이 있을 것입니다.
● 일본의 강점을 살릴 수 있다 도메인 특화 생성 AI 개발로
LLM을 활용한 범용성이 높은 언어 생성 AI 개발은 기존 제품화를 진행하는 한편, 특정 도메인용 소규모 언어 생성 AI 개발은 지속해야 할 것입니다(※2).
그 이유는 해외 대형 플랫폼 기업들의 진입 가능성이 낮고, 시장성이 있기 때문입니다. 여기서 말하는 도메인이란 제조, 건설·토목, 물류, 소매, 농업, 요양 등 업종과 그에 따라 세분화된 영역, 그리고 영업·법무·노무 관리 등 개별 업무를 포함합니다.
다만, 도메인에 따라서는 해당 분야에 특화된 생성 AI보다 범용형 생성 AI 단독이거나 RAG(검색 확장 생성) 등 외부 데이터베이스와 결합된 형태가 더 적합할 수도 있습니다. 또한 도메인 고유의 제약, 예를 들어 업계 규칙이나 안전성 등이 존재한다면, 해당 도메인에 특화된 AI가 유용하며, 도메인 선택이 중요합니다.
아시다시피, 일본에서도 법무(계약), 제조, 물류, 의료, 금융, 행정 등 몇몇 분야에서 도메인 특화형 생성 AI가 이미 개발·활용되고 있습니다. 계약서 작성·관리 생성 AI는 양식에 맞춘 계약서를 작성하고, 확인 사항이나 누락된 부분을 감지하는 등 다양한 작업을 수행하는 도구입니다.
계약서는 오류에 대한 허용 범위가 낮은 반면, 문서화된 규칙과 양식이 많다는 특징이 있어, 범용형 생성 AI보다 해당 도메인에 최적화된 언어 생성 AI가 더 적합한 분야라고 할 수 있습니다.
하지만 해외 진출에는 전략이 필요합니다. 가령 일본의 도메인 전용 생성 AI를 해외에 도입하려 해도, 업무 방식이 다르면 재학습을 포함한 수정이 필요합니다.
또한 퍼지는 곳에 이미 현지 업무에 적합한 유사한 도메인 특화 생성 AI가 존재할 가능성도 있습니다. 도메인 특화 AI는 업무 방식에 따라 달라집니다. 이때 유망한 전략은 업무 도구로 AI를 수출하는 것이 아니라, 그 AI를 활용한 업무 방식을 그대로 수출하는 것입니다.
※2 소규모 언어 생성 AI는 범용성이 떨어지고, 과적합이나 할리우드화가 발생하기 쉬운 것으로 알려져 있습니다. 또한, 공격에 대한 내성이 강하다고는 할 수 없습니다. 이러한 한계를 잘 이해하고 활용해야 합니다.
● 일본의 업무 방식을 해외에 알리기 ‘선행자 우위’를 만들어라
생성 AI가 제시하는 새로운 업무 방식으로, 수출이 더욱 기대되는 사례를 들어보자. ‘안전성’과 ‘고품질’은 일본 기업이 강점으로 삼고 있는 부분이며, 일본식 업무 방식을 그대로 해외에 확장할 가능성이 있습니다. ‘소리 내기’와 ‘가리키며 부르기’는 대상을 보면서(가리키는 대상을 손가락으로 가리키며) 소리를 내고, 스스로 귀로 듣는 동작을 결합함으로써 인간 오류를 방지하고, 주의력과 집중력을 높여 업무의 안전성을 향상시킵니다. 일본에서는 철도업뿐만 아니라 제조업과 건설업에서도 시행되고 있지만, 해외에서는 선박·항공업계 등 일부를 제외하고는 도입이 거의 없다고 할 수 있습니다. 이 때문에 해외 사람들에게는 ‘소리 내기’나 ‘가리키며 부르기’가 이상하게 보일 때도 있는 것 같습니다.
하지만 앞으로는 음성 입출력 AI와 언어 생성 AI를 결합함으로써, AI가 작업자의 ‘목소리 내기’를 청취하고, 그 작업자뿐만 아니라 AI도 안전 확인에 참여할 수 있게 됩니다. 이 결과, ‘소리 내기’를 통한 안전 확인 효과가 크게 향상될 것으로 판단되며, 해외에서도 ‘소리 내기’ 등을 도입하는 사례가 늘어날 것으로 기대됩니다(※3).
이때 일본의 승리 전략은 도구로서의 AI를 해외에 확장하는 것이 아니다. 일본의 업무 방식 중에서 AI 활용을 통해 효율성과 안전성을 높일 수 있는 방안을 찾아 구축하고, 그 업무 방식을 해외에 확대하며, 그 과정에서 지원 AI도 해외로 확장될 것입니다.
일본의 업무 방식을 해외에 확대하는 방법에 대해 정부가 판매하는 방안도 가능하지만, 컨설팅 방식이나 ISO9001과 같은 국제 표준 업무로 전환하는 방법도 있습니다. 그 중에서도 업무에서의 ‘안전성’과 ‘품질’은 일본이 앞서 있으며, 국제 표준화가 쉬운 대상입니다.
그 안전성과 품질을 중시하는 업무 방식이 국제 표준이 된다면, 일본의 업무 방식을 뒷받침하는 AI는 자연스럽게 우위를 점하게 될 것입니다. 또한, 그때 AI 활용은 업무 방식을 국제 표준화할 때 금빛 깃발처럼 빛나는 역할을 하기 쉽다고 할 수 있습니다.
AI는 결국 업무를 진행하는 수단에 불과합니다. 따라서 AI 개발에서는 업무를 깊이 이해하고 있는 사람이 유리합니다. 예를 들어, 기업 회계 제도를 해외 제도에 맞추면 회계 시스템 개발에서 해당 제도에 정통한 해외 기업이 더 유리해졌습니다. 반대로 말하면, 일본의 업무 방식을 해외에 알리면, 이를 지원하는 AI 개발·제공에서 일본은 선도권을 확보할 수 있습니다.
※3 AI 도입과는 직접적인 관련은 없지만, ‘지시 호출’은 1996년에 뉴욕 지하철, 2019년에는 리우데자네이루 근교 철도에서 채택된 실적이 있습니다.
사토 이치로
https://news.yahoo.co.jp/articles/c68bc8ab4e51ad370c2e9d4cb0f33f32636939b9?page=1