[4월 1주] AGI 개발 위한 3가지 포인트...
기술·인프라 그리고 데이터
인공일반지능(AGI)에 대한 소식은 언제나 큰 관심입니다. 이번 주에는 관련 뉴스가 몇개 등장했습니다.
일반적으로 AGI 달성 여부를 가늠할 때 가장 먼저 고려하는 것은 모델 기술입니다. 현재 대형언어모델(LLM)의 한계를 넘어, 진짜 사람처럼 생각하는 AI를 개발할 수 있느냐는 점입니다.
이에 대해서는 연구 개발이 끊임없이 이뤄지고 있고, 특히 지난해부터는 수학적인 능력에 초점을 맞춘 주요 발전이나 로봇을 이용해 현실 세계를 이해하는 새로운 방법이 등장하고 있습니다.
그런데 기술만큼이나 중요한 문제들이 부각되고 있습니다. 바로 인프라와 데이터입니다.
마이크로소프트(MS)와 오픈AI가 AGI 개발을 위해 2030년까지 수백만개의 AI 칩을 갖춘 슈퍼컴퓨터를 구축한다는 소식이 전해졌습니다. 여기에 들어가는 비용은 1000억달러(약 134조7000억원)에 달합니다.
현재 세계에서 가장 GPU를 많이 갖춘 메타의 데이터 센터에는 GPU가 2만4576개가 포함돼 있다고 합니다. 즉 MS와 오픈AI가 밝힌 '수백만개'는 이보다 100배를 넘는 규모입니다.
GTC에서 공개된 차세대 GPU '블랙웰'의 경우 개당 3만~4만달러(약 4000만~5350만원)에 달할 것으로 보입니다. 100만개만 해도 300억달러, 즉 40조원입니다. 비용은 물째치고 이 정도 물량을 확보할 수 있을지 주목됩니다.
전력 문제도 만만치 않습니다. 데이터 센터 규모가 점점 커지며 기존 전력 수급으로는 이를 감당하기 어려워진다는 지적입니다. 이 때문에 클라우드 업체들은 재생 에너지나 핵발전 등 갖가지 방법을 강구하고 있습니다.
그리고 LLM 학습을 위해 가장 중요한 데이터 문제도 지적되고 있습니다. 향후 2년 안으로 AI 학습에 필요한 인터넷 데이터가 바닥을 드러낼 것이라는 지적이 나왔습니다.
인터넷에는 쓸만한 자료가 많지 않고, 저작권 문제가 강화되며 데이터 확보가 어려워진다는 이유입니다. 이에 따라 학습량을 늘리고 매개변수를 키우는 방식으로 성능을 높이는 LLM 개발 방식이 지속되기 어려울 것이라는 예측입니다.
어쨌거나 과거에는 SF에서나 볼 수 있었던 AGI가 점점 실체화되는 분위기입니다. 과학자나 전문가들이 5~10년 내로 AGI가 현실화될 것이라고 지적하는 데에는 이유가 있습니다. 그리고 해결할 문제도 구체화되고 있습니다.