美中 물량공세...韓AI, 오픈소스가 살길 61130114 이데일리

AI 양강구조 속 생존전략 부상'중국 특허수 9배, 미국 투자금 48배자원 제한 韓 독자개발 고집 땐 한계오픈소스 기반 기술속도.효율 높여야핵심 알고 수정.대응하는 능력 관건글로벌 인공지능(AI) 패권 경쟁에서 미국과 중국이 자본 인프라.맨파워를 앞세워 양강 구도를 굳히는 가운데 자원이 제한적인 한국은 '순수 독자 개발' 프레임에서 벗어나 오픈소스 기반의 실용주의 전략으로 속도와 효율을 높여야 한다는 지적이 나온다.12일 세계지식제산권기구(WIPO) 보고서에 따르면 2014~2023년 기준 전 세계 생성형 AI 특허 점유율은 중국이 3만8210건(69.6%)으로 1위 , 미국이 6276건으로(11.4%)으로 2위다.한국은 4155건(7.6%)으로 3위권에 올랐지만 1위 중국은 한국의 약 9배에 달한다.투자 격차는 더 크다.'AI 인덱스 2024'에 따르면 미국의 민간 AI 투자 규모는 672억 2000만달러(약100조원), 중국은 77억6000만달러(약 11조원)로 집계됐다.한국은 13억9000만달러 (약 2조원) 수준으로 절대 규모에서 큰 차이를 보인다.자본의 열세는 곧 인프라 격차로 이어진다.국내 스타트업과 대학은 그래픽퍼리장치(GPU) 확보가 쉽지 않아 대규모 언어모델(LLM) 개발 자체가 제약을 받는다는 평가가 나온다.국내 AI 스타트업 업스테이지의 김성훈 대표도 '독자 AI 파운데이션 모델 컨소시엄에 선정돼 GPU 500장을 확보한 뒤에야 본격 개발을 시작할 수 있었다'고 밝힌 바 있다.이런 현실에서 오픈소스 활용은 '선택'이 아니라 '생존 전략'으로 부상하고 있다.글로벌 표준 모델을 바탕으로 한국의 특화 데이터를 학습시키는 방식은 개발 기간을 줄이고 비용 효율을 높일 수 있어서다.정부가 약 2000억원 규모로 추진 중인 '독자 파운데이션 모델 프로젝트' 역시 이 같은 방황성과 맞닿아 있다.일부 업체가 해외 오픈소스를 활용했다는 논란이 제기되지만 활용 자체를 문제 삼기보다 활용의 범위와 방식, 통제 역량을 따져야 한다는 주장이다.최병호 고려대 AI 연구소 교수는 '오픈소스활동은 자연스러운 흐름'이라면서도 '국가 차원에서 쓸 때는 가중치 등을 그대로 가져오는 방식을 경계해야 한다'고 강조했다.오픈소스를 쓰더라도 핵심 요소를 얼마나 이해하고 수정.대응할 수 있느냐가 기술주권의 관건이라는 뜻이다.한 AI업계 관계자는 '오픈소스를 기반으로 빠르게 글로벌 수준의 모델을 만들고 이를 바탕으로 경쟁력 있는 모델을 다시 공개해 해외가 활용하도록 만드는 것 자체가 기술력을 입증하는 길'이라고 말했다.                                                                            김현아.윤정훈 기자中딥시크도 못 피한 유사성 논란...핵심은 오픈소스 재구성.관리역량 美 빅테크 AI기술 통제 속오픈웨이트 생태계 넓히는 中학습 데이터 핵심은 비공개유사성 논란 불거진 韓국대AI'오픈소스를 사용했나'가 아닌 '어떻게 바꾸고 통제하나'가 핵심정확한 라이센스 표기도 중요AI 패권 경쟁의 키워드로 '오픈'이 급부상하고 있다.그러나 같은 '열림'이라도 미국과 중국이 이를 활용하는 방식은 확연히 다르다.미국은 공개를 통해 생태계를 넓히되, 상업 경쟁력과 책임.안전 이슈를 이유로 핵심 역량은 통제하는 흐름이 강하다.반면 중국은 오픈 웨이트(가중치 공개) 모델을 전면에 내세워 개발자 생태계를 끌어들이는 데 공을 들인다.한국은 정부 주도의 '독자 AI파운데이션 모델' 프로젝트를 추진 중이지만, 글로벌 오픈소스.오픈웨이트를 참고할 가능성이 큰 만큼 쟁점은 '사용 여부'가 아니다.무엇을 썼는지, 라이선스를 어떻게 관리하는 지, 문제 발생 시 즉시 수정.대응할 통제 역량을 갖췄는지가 더 큰 과제로 떠오르고 있다.오픈소스, 무엇이 '열려' 있어야 하나유픈소스는 원래 소스코드를 공개해 누구나 사용.수정.재배포할 수 있도록 하는 개발 방식이자 라이센스 체계를 뜻한다.하지만 AI로 오면 경계가 복잡해진다.모델은 코드(학습.추론 스프트웨어), 가중치(학습 결과물), 데이터(학습 자료)로 구성되는데 , 무엇을 공개하느냐에 따라 권리와 책임의 범위가 달라진다.이 때문에 업계에서는 '오픈소스'와 구분헤 '오픈 웨이트'라는 표현을 쓴다.가중치를 공개해 외부에서 실행.검증'개조가 가능하더라도, 학습 데이터나 학습 과정, 운영 노하우는 공개하지 않을 수 있고 이용 조건은 라이선스가 좌우하기 때문이다.미국, '연구는 개방.코어는 통제'미국 빅테크의 기본 방향은 '개방은 확산을 위해, 통제는 경쟁력과 책임을 위해'로 요약된다.오픈AI가 오픈 웨이트 모델을 별도 라인업으로 공개하더라도, 주력 상용 모델은 응용프로그램인터페이스(API) 기반으로 관리하는 방식이다.이를 테면 오픈AI는 '오픈 웨이트' 모델인 gpt-oss-120b, gpt-oss-20b를 공개했지만, GPT-5.2는 별개 라인업으로 두고 있다.공개 범위를 조절해 생태계의 혁신 속도는 흡수하되, 상업 경쟁에서의 차별화와 악용 위험, 규제.소송 리스크는 내부에서 관리하겠다는 계산이 깔려 있다는 해석이다.다만 '오픈'의 경계는 더 논쟁적이 됐다.메타 라마(Llama)처럼 '오픈' 간판을 내걸었지만 제한 조항을 두면서 '오픈소스라 부를 수 있느냐'는 분류 논쟁이 계속되는 점이 이를 보여준다.중국은 오픈 웨이트를 앞세워 개발자 풀을 빠르게 넓히는 전략을 취하고 있다는 평가가 많다.알리바바의 큐원(Qwen) 계열처럼 갓허브.허깅페이스 등에서 접근성을 높인 사례가 대표적으로 거론된다.다만 오픈 웨이트 확산이 곧 '완전한 투명성'을 의미하는 것은 아니라는 반론도 있다.학습 데이터, 학습 방법, 서비스 운영 노하우 같은 핵심 요소는 공개 범위 밖에 남는 경우가 많아 '오픈처럼 보이되, 장악은 내부에 두는 방식'이라는 평가다.'국가대표 AI'로 거론되는 LG AI연구원(K-EXAONE), SK텔레콤(A.XK1), 네이버클라우드(HyperCLOVAX), 업스테이지(SOLAR), NC AI(VAETKI) 역시 '완전 신설계'라기보다 공개 연구 성과를 바탕으로 구조를 조합하고 성능을 끌어올린 형태로 평가된다.MoE(Mixture of Expects)처럼 여러 '전문가'를 선택해 계산하는 구조에서 기본 설정이 닮아 있는 반면, 전문가 쏠림을 막는 로드 밸런싱(보조 손실) 적용 방식, 문맥을 처리하는 어텐션 구조(MLA.GQA.혼합형), 전문가 반영 강도(routed scaling) 같은 세부 파라미터에서 차별화가 나타난다는 식이다.결국 같은 뼈대 위에서 튜니이과 운영 노하우가 실질 경쟁력으로 부상하는 구조다.반면, 메타나 미스트랄, 딥시크 같은 선발 글로벌 AI기업들은 '왜 이 모델이 새상에 필요한가'에 대한 철학적 해답을 수식으로 증명해냈다는 점에서, 대한민국 AI의 갈 길이 아직은 멀다는 평가도 나온다.이를테면 딥시크는 자본의 취약점을 수학적 천재성으로 극복했다.문맥 정보를 잠재 공간에 압축해 메모리 부담을 낮춘 MLA(Multi-head Latent Attention) 기술로 글로벌 AI판도를 뒤흔들었고, 알리바바 큐원(Qwen)은 모든 언어와 코드를 가장 효율적으로 차리하기 의해 15만 개 이상의 거대 어휘집(Tokenizer)을 수학적으로 최적화했다.최근에는 인간의 사고 과정을 모사하는 시스템-2 수식 설계를 통해 추론 모델 QwQ로 진화하고 있다.국가대표 AI들이 오픈소스를 활용하는 만큼 유사성 논란이 뒤따르는 것은 불가피하다.해외에서도 딥시크가 2025년 1월 기준 모델 출력물을 학습해 결과를 내놓는 방식인 '증류'(distillation)를 택했을 가능성이 제기되며 논쟁이 커졌고, 오픈AI가 관련 의혹을 검토한다고 밝힌 바 있다.딥시크, 오픈AI 모델 증류 의혹이 같은 논쟁이 반복될수록 초점은 '오픈소스를 썼느냐'가 아니라 '무엇을 , 왜, 어떻게 썼는가'로 이동한다.어떤 구성요소를 선택했고(비용.기간.성능 목표), 적용 과정에서 무엇을 얼마나 바꿨는지(개선 범위.재현 가능성), 이를 어떻게 설명.검증할지, 문제가 생기면 누가 어떤 권한과 인력으로 수정.대응할지가 핵심이라는 평가다.이에 따라 '독자AI 파운데이션 모델'의 평가는 '무엇을 통제할 수 있느냐'로 옮겨가고 있다.라이선스,출처 표기 체계와 사전 문서화, 사후 대응 체계를 갖추라는 요구가 커지는 배경이다.강상기 한양대 AI솔루션센터장도 '이론적 순결성보다 실용이 중요하며, 유사성 논란을 피하기보다 표기.설명.사후 대응 논리와 통제력을 갖추는 것이 핵심'이라고 강조했다.                                                                       김현아.윤정훈 기자