AI 언변·지략에, 전략게임마저 인간이 졌다
◇ 메타가 개발한 AI ‘키케로’
온라인게임 ‘디플로머시’서 인간 제압◇
ㅡ곽수근 . 기자
“내가 튀니지 차지할게”
“안 돼. 내가 할래. 너는 세르비아 가져가면 되잖아”
“세르비아는 불가능한 목표야”
“그럼 그리스는 어때?”
최고의 외교 전략 게임으로 꼽히는 ‘디플로머시(Diplomacy)’에서 사람과 인공지능(AI)이 채팅으로 대화를 나눈 내용 가운데 일부다. AI와 맞선 게이머들은 상대가 AI임을 전혀 눈치 채지 못했다. 그만큼 채팅 대화가 자연스러웠다는 얘기다. 바둑, 체스, 포커와 달리 디플로머시 게임은 대화를 통해 협조를 얻어내거나 심지어 속이기도 해야 하기 때문에 AI가 인간을 이기기 어려운 게임으로 꼽혀왔다. 이를 극복한 인공지능이 등장하자 과학기술계에서는 기대와 우려가 교차하고 있다.
유럽 대륙의 패권을 놓고 때론 협상을 통해, 때론 배신 전략을 동원해 승부를 겨루는 디플로머시 게임. AI가 인간을 이기기 어려울 것이라던 이 게임에서 메타(페이스북)의 AI '키케로'가 온라인 리그 상위 10% 안에 드는 성과를 냈다. /GameFabrique
◇협상과 배신의 귀재 된 AI
메타(페이스북)의 인공지능 키케로를 개발한 연구진은 최근 국제 학술지 사이언스에 키케로가 ‘디플로머시’ 온라인 게임 리그에서 상위 10% 안에 드는 성과를 냈다는 연구 결과를 발표했다. 1959년에 출시된 보드게임 디플로머시는 7명의 플레이어가 러시아, 영국, 프랑스, 독일 등 유럽 7국 지도자가 돼 서로 동맹과 전쟁을 통해 영토를 차지하는 게임이다. 궁극적으로 한 나라가 최후의 승자가 되기 위해선 동맹국과도 갈라서야 해 게임이 막바지로 치달을수록 참가자들이 서로 배신에 배신을 거듭한다.
메타는 고대 로마 정치인 키케로에서 착안해 명명한 AI를 전략적 추론, 자연어 처리(NLP·Natural Language Processing) 등 두 가지 축을 중심으로 개발했다. 인간을 상대로 자연스러운 대화를 하기 위해 12만번 이상의 게임 데이터를 확보해 훈련했고, 게임에서 오간 1290만건의 채팅 메시지를 학습했다. 이를 통해 상대의 동맹 제안 진위를 판단하고 역으로 상대를 속이는 방법을 익혔다. 예컨대 동맹을 제안하고 병력 호송을 요청한 뒤 방심한 동맹국의 뒤통수를 치고 공격해 영토를 차지하는 식이다.
이렇게 탄생한 키케로는 온라인 게임리그에서 실전 경험을 쌓으며 ‘협상과 배신의 귀재’로 성장했다. 지난 8~10월 온라인 리그에서 40경기를 펼쳐 상위 10%에 오르는 성과를 냈다. 이 기간 AI가 인간 게이머들에게 보낸 메시지가 5200여 개에 이른다. 키케로 개발에 참여한 이들조차 이렇게 빨리 능숙한 수준에 오를지 몰랐다며 놀랄 정도였다.
◇노벨상 탄 이론도 AI 전략에 장착
알파고로 유명한 구글 딥마인드가 개발한 인공지능 딥내시(DeepNash)도 전략 보드게임 ‘스트래티고(Stratego)’에서 눈부신 실력을 뽐내고 있다. 1946년에 출시된 이 게임은 자신이 가진 불완전한 정보를 바탕으로 숨겨진 상대의 깃발을 찾아내는 것이 목표다. 서로 상대 정보를 알지 못하는 가운데 정보를 확보하고 허세로 상대를 속여야 하는 게임으로 AI가 앞서기 어려울 게임으로 꼽혔지만, 딥내시가 예상을 깨고 세계 최고 수준에 올랐다. 사이언스에 최근 발표된 논문에 따르면, 딥내시는 올해 온라인 게임 리그에서 인간 고수들을 차례로 깨고 승률 84%를 기록하며 역대 세계 랭킹 3위에 올랐다. 영화 ‘뷰티풀 마인드’의 주인공이자 노벨 경제학상 수상자인 존 내시 교수의 이름을 따온 딥내시는 알고리즘에 내시 교수의 이론(내시 균형)을 적용했고, AI 스스로 55억회 게임플레이를 통해 전략을 연마했다.
◇“AI 비서에 활용” “범죄에 악용될 것” 논란
빅테크들이 전략적 추론이 가능한 AI 개발에 경쟁적으로 나서는 것은 AI를 활용한 가상(virtual) 비서와 로봇 시장으로 확장 가능성이 크기 때문이다. AI 가상 비서 시장은 2026년에는 현재보다 2배 성장해 63억달러(약 8조3000억원)에 이를 것이라는 전망도 있다.
하지만 인간을 속일 정도로 똑똑해진 AI를 이용한 범죄가 급증할 것이라는 지적도 나온다. 미국에서는 메타가 키케로 소스 코드를 공개해 범죄에 악용될 것이라는 우려가 이어지고 있다. 김명주 서울여대 정보보호학과 교수는 “게임에서 인간을 속이는 AI 기술이 보이스피싱과 결합되면 지금과는 비교할 수 없을 정도의 신종 범죄가 나타날 수 있고 이로 인한 사회적 비용도 급증할 것”이라고 했다.
* 출처 : 조선일보 2022년 12월 8 일자. 곽수근기자