|
졌어. 이세돌이.....
아마 기사 전석진 변호사의 글입니다.
ㅡㅡㅡㅡㅡㅡㅡㅡㅡ
구글은 전세계 바둑인에게 사과하여야 한다
법무법인 한얼
변호사 전석진(필명 General Intellect)
구글은 Fan Hui와의 대결과 앞으로의 이세돌과의 대결에 있어서 먼저 전세계의 바둑인들에게 사과를 하여야 합니다.
구글이 바둑을 마스터하였다고 주장하여 세계의 바둑인들을 오도하였습니다.
그러나 구글의 바둑 프로그램 알파고(AlphaGo)가 바둑의 원리를 마스터 한적이 없습니다
그리고 알파고가 Fan Hui와 둔 것은 “바둑”이 아닙니다.
그저 아무 계산이나 예상도 없이 무한한 컴퓨터 자원을 이용한 지능 1세짜리도 할 수 있는 계산을 답이 나올 때까지 계속한 것입니다.
이것은 인간이 할 수 없는 것입니다.
이번 대국은 과연 바둑이 무엇인가?라는 근본적인 질문을 하게 하는 심대한 의미가 있습니다.
천천히 살피기로 합니다.
구글이 2014년 5천억원을 주고 인수한 DeepMind라는 회사가 있습니다. 지금은 Google DeepMind라고 불리웁니다. 이 회사가 AlphaGo라는 “바둑” 프로그램을 개발하였습니다.
15명이 개발하였다고 합니다.
그런데 이 바둑 프로그램이 인공 지능 분야에서 향후 10년 또는 30년 간 불가능하다고 생각되던 일을 해냈습니다.?
프로기사를 5:0으로 완패시킨 것입니다.
세상은 경악했습니다.
가장 유명한 과학지인 네이처 지에서 표지 기사로 알파고의 이론을 게재하였습니다.
센세이셔널합니다.
그런데 그것도 모자라 이제는 세계 최고의 고수인 이세돌 9단에게 도전장을 내밀었습니다.
이 사실은 전세계 언론에 널리 홍보되었고 또 다른 충격을 주었습니다.
이세돌 9단은 별 생각 없이 기쁜 마음으로 수락하고 자신이 이길 것이라고 자신하였습니다.
제가 이것이 희대의 사기극이라고 생각하고 페이스 북에 제 견해를 먼저 밝혔습니다.
성급한 결론을 먼저 쓴 것이었습니다 한 시간 동안 기사를 찾아 본 것 이외에 더 찾은 것은 없었습니다.
1. 이세돌 필패
지금 이대로 이세돌 9단이 AlphaGo와 대국하면 승산이 없다는 것은 여러 차례 말씀 드린 바가 있습니다. 그러면 이세돌 9단이 이길 전략은 없는 것일까?
Zero-Hour Research가 한번 승전 전략을 연구해 보겠습니다
저는 이렇게 썼습니다.
이것은 제가 알파고에 대하여 알아본 후에 이야기 한 것은 아닙니다.
게임이론이라는 학문에 의거 말한 것입니다.
그 내용을 조금 말씀 드리겠습니다.
게임 이론은 현재에 와서는 미시 경제학의 기초가 되었습니다.
처음 게임이론이 성립된 것은 아래와 같은 사례에서 시작되었습니다
미국 시카고에 갱단들이 너무 많았습니다?
한 갱단과 그 옆의 갱단 사이에 전쟁이 나면 무수한 부하들이 죽었습니다.
그리하여 승리를 하여도 진정한 승리가 못되었습니다.
왜냐 하면 그 전 전쟁에서 부하들을 너무 많이 잃어 바로 옆에 있는 갱단이 쳐들어 오면 대항을 할 수 없게 됩니다. 결국 간신히 빼앗은 모든 “나와 바리”를 빼앗기게 됩니다
그래서 어떤 갱단 두목 하나가 기가 막힌 아이디어를 냈습니다 옆 갱단 두목에게 말했습니다
“우리가 싸우는데 부하들 가지 동원하여 싸우면 결국 너나 나나 영토를 빼았기게 되니 부하들은 놔두고 두목끼리 내기를 해서 이긴 자가 영토를 가지는 것으로 하자”
그 옆 갱단 두목도 그 말이 사리에 타당하므로 이에 응하기로 하였습니다.
“내기를 어떻게 할까?”
하니까 내기를 제안한 두목이” 야 깡패라는 것이 깡의 대결 아니냐 목숨을 걸고 먼저 피하는 놈이 지는 것으로 하자”
그래서 제안한 방법이 외길에서 양쪽에서 오토바이를 전력으로 질주 해와서 먼저 피하는 놈이 지는 것으로 하자는 것이었습니다
두 번 째 두목 놈은 그렇게 하자고 하였습니다.
시합 날이 되었습니다
시합장에 나갔습니다
두번째 두목 놈이 보니 오토바이를 타고 있는 제안한 두목 놈이 눈에 눈가리개를 하고 있는 것이었습니다
결국 중간도 가지 못하고 두 번 째 두목 놈은 피하였고 게임에서 졌습니다
여기서 게임이론의 원칙이 나옵니다 무조건 먼저 게임을 제안한 편이 이긴다
승전 전략-수정 제안
그럼 누구에게 게임을 제안 받았을 때 어떡하면 이길 수 있을 까요?
반드시 수정 제안을 하여야 합니다
만일 두 번 째 두목이 “좋다 오토바이를 타고 마주 달려 오는데 눈가리개 하기는 없다” 라고 제안하였다면 승부는 아무도 몰랐을 것입니다
2. 내기의 규모
사람들은 구글이 이세돌에게 10억원을 걸었다고 하여 이 게임이 10억원 짜리 라고 생각하고 있습니다.
그러나 미국 언론들의 견해는 그렇지 않습니다.
만일 구글이 이 승부에서 이기면 구글은 꿈의 기술이 인공 지능 분야에서 가장 앞서가는 회사로 인정 받고 구글의 시가 총액이 수조원 상승할 것이라고 보고 있습니다.
저는 이 견해가 정확한 견해라고 생각합니다]
즉 이 게임은 구글이 수조원을 걸고 하는 게임인 것입니다.
그래서 이세돌이 지는 것입니다.
구글이 승산 없이 수조원을 건다고 생각할 수 없다는 것은 상식적인 것입니다
그럼 어떻게 이런 확신이 나왔는가를 알아야 합니다.
2. 알파고의 논문 검토-결과 이세돌 필패!
이세돌 필패!
By General Intellect
위와 같은 제목으로 아래와 같이 썼습니다.
“오늘까지 DeepMind사의 AlphaGo기술에 대한 논문을 일별하였다
논문의 제목 및 링크는 아래에 정리하여 놓았다.?
오늘까지의 리서치의 결론은 이세돌은 필패라는 것이다.
참고로 나는 바둑 강일급이다?
잠실종합 체육관에서 열린 바둑 대회에 나가서 파죽의 7연승을 하고 맨 앞줄에 나갔는데 갑자기 전두환 대통령이 들어 오더니 나에게 악수를 청하였다 그래서 얼떨결에 악수를 하였다
그 판에서 반집 지고 나오는데 같이 바둑 대회에 나갔다가 미리 져서 나를 기다리던 친구가 말했다 “야 피 뭍은 손을 내민다고 그 손을 잡으면 어떡하냐?” 라고…… 나는 대답했다 “야 자식아 너도 그 자리에 있어봐 그렇게 안되나”라고……
Fan Hui와 AlphsGo와의 다섯 개 대국을 복기해 보았다.
한판은 계가 바둑이어서 FanHui가 두 집 반을 지고 나머지는 모두 불계 패를 했다.
논문을 다 살펴 보아도 기존의 DeepMind사의 기술은 아타리 게임의 49개 중 28개 정도를 이기는 것이어서 바둑을 이기기는 힘든다는 생각이 들었었다
그런데 위 FanHui와의 대국을 보니 그렇지 않다.
AlphaGo는 실착이 하나도 없다
그리고 FanHui가 실착을 하면 여지 없이 응징하여 불계승을 한다.
실착을 하지 않는 상대를 이길 수 없다는 것은 바둑계의 일반적인 상식이다
어떻게 된 일일까?
내가 미국으로 유학 갔다 와서 정보 통신 쪽에 집중하기 이전에 태평양에서는 기업 인수 합병(Merger & Acquisition: M&A)일을 많이 했다 이 점에 관하여 외부 강연도 하고 그랬다 그래서 M&A에 대하여는 조금 안다
기업 인수는 시너지 효과 즉 그 기업을 인수하여 자신의 기존 기술과 합하여 상당한 부가가치를 만들 수 있는 경우에 인수를 하는 것이고 그런 것이 없으면 인수를 안 한다.
페이스북이 DeepMind인수를 검토하다가 2013년에 그만 두고 그 후에 구글이 인수하였다.
페이스 북은 아타리 게임 49개중 28개 정도 이기는 기술은 가치가 없다고 본 것이다.
구글은 DeepMind의 현재 기술은 그리 훌륭하지 않지만 구글이 가지고 있는 기술을 접목하면 훌륭한 기술이 될 수 있다고 판단한 것 같다
아니나 다를까 구글이 DeepMind를 인수하고 나서 얼마 안된 작년 말에 도저히 수십 년 내에는 불가능할 것이라고 여겨 지던 바둑 유럽 챔피언을 이겼다.
그리고 세계 챔피언인 이세돌 9단에게 도전장을 낸 것이다.
이것은 구글의 기술이 접목되지 않았다면 불가능한 것으로 생각된다
나는 구글에 대해 좀 알기 때문에 구글이 어떤 기술을 접목하였는지를 추측할 수는 있다 –도저히 이세돌 9단이 못이기는 기술일 것이라고 추정된다.
그런데 이 구글의 기술이 어던 것인지는 전혀 알려져 있지 않기 때문에 내가 분석하여 대책을 만들 수가 없다.
결국 내가 처음에 예견한 대로 그리고 그 게임 이론에 따라 이세돌 9단이 지게 되어 있는 것이다.”
3. 추가 연구
그렇지만 여기서 그만 두면 제 자존심이 허락하지 않았습니다.
지더라도 왜 지는지는 알아야겠다고 생각하였습니다.
제가 이 승부에 관하여 세 개의 글을 페이스 북에 포스팅하였습니다.
첫 번째 글은 이세돌이 진다는 것이었습니다. 이에 대하여는 이 글을 정면으로 포스팅하기 이전에 카톡 등 다른 SNS에서 이세돌이 질 거라는 것에 4만원을 베팅한 바 있습니다.
두 번째 글은 “희대의 사기극”이라는 제목으로 글을 썼습니다.
이세돌 9단이 지기는 지지만 승부가 공평하지 않다는 생각에서 입니다.
그리고 아타리 게임(미국 Atari 사가 만든 아케이드 게임)도 제대로 못이기는 알파고가 바둑에서 세계최고의 고수를 이긴다는 것은 무언가 트릭이 있다고 생각하여서 입니다.
첫번 째 이세돌 9단이 지는 일응의 근거에 대하여는 이미 살핀 바가 있으므로 두번 째 글의 의미를 살펴보겠습니다.
1. 사기의 의미
저는 변호사 이므로 사기의 법적 의미를 살피기로 하겠습니다.
참고로 저는 미국 켈리포니아 변호사 시험에 합격한 바 있기 때문에 미국법을 조금 압니다.
미국 법 상 사기의 요소는 다음과 같은 점을 고려합니다.
사기는 말이나 행동으로 또는 거짓이거나 오해스러운(misleading) 언동으로 또는 마땅히 공개하였어야 할 것을 숨김으로써 다른 사람을 속이고 그 속은 사람으로 하여금 그것을 믿고 어떤 피해되는 행동을 하게하는 것, 그것입니다.
사기를 판명할 때
1) 첫째 그 말이 중대한 것이어야 합니다
2)피고가 그 사실이 거짓임을 알고 있어야 합니다.
3) 고의가 있어야 합니다
4)피해자가 그 말을 믿었어야 합니다
5)그 결과로 피해자가 피해를 입었어야 합니다.
오해스러운 언동에 의해 사기의 경우에는 정보의 비대칭성이 중요하게 작용합니다 즉 일방 당사자가 우월한 지식을 가지고 있을 때에는 쉽게 사기가 인정됩니다
특히 피해자가 오해스러운 언동을 한 당사자에게 신뢰를 가지고 있을 경우 특히 그렇습니다.
침묵도 사기가 될 수 있습니다.
증권거래법 상의 사기는 별도로 정의되나 이점은 살피지 않기로 하겠습니다.
2. 구글이 이 세기의 대결에 관하여 언론에 발표한 내용들
가. 인공 지능에 의한 바둑의 정복
구글은 알파고가 바둑을 마스터했다고 주장했습니다.
그래서 다른 사람들이 이것은 인공지능의 도약적 발전이라고 감탄하였습니다
2-3년 전만해도 바둑두는 사람들과 게임 프로그래머들은 바둑은 너무 복잡하기 때문에 컴퓨터가 인간 전문가를 이기는 데에는 3-4십년 걸릴 것이라고 믿었습니다?
그런데 구글이 갑자기 바둑을 정복하는 프로그램을 개발하였다고 하더니 작년 11월에 영국에서 프로 2단을 이겼습니다?
그리고 이제는 세계 최고의 고수인 이세돌 9단을 이길 것이라고 공언하였습니다.
구글 팀의 팀장인 Demis Hassabis는 Fan Hui를 이김으로써 우리 프로그램은 인공지능의 오래된 도전을 성취하였다고 말하였습니다
그리고 Demis Hassabis는 이 기술이 앞으로 일반적인 인공 지능(Artificial General Intelligence: AGI)을 개발하는데 기여를 할 것이라고 하였습니다 자신들의 방법은 일반적인 목적을 가지고 있다고 누차 말하였습니다.
즉 바둑을 넘어서 인간 생활의 모든 분야에 적용될 수 있는 기술이라고 한 것입니다.
컴퓨터가 바둑 게임에서 인간을 이긴 것은 세계의 가장 큰 문제를 해결한 것이라고 MIT에서는 보고 있습니다.
그리고 자신들의 기술은 인간의 생각과 동일한 구조를 가지고 있다고 하고 있습니다
구글의 업적은 이 분야의 다른 연구자들에게 경이로움으로 받아들여 졌습니다.
기념비적 기여라고 평가받았습니다.
자신들의 프로그램을 직관을 가지고 있는 프로그램이라고 이야기 하였습니다 그러면서 뉴턴을 예를 들며 자신들의 프로그램이 뉴턴의 직관을 가진 것이라고 하였습니다.
이전 까지만 해도 직관은 인간 만이 가지고 있는 것이라 생각했는데 알파고가 컴퓨터가 그런 직관을 가지고 있다고 한 것입니다.
뉴턴이 직관에 대하여 이렇게 말했습니다
“나는 그냥 안다” “나에게 가설 같은 것은 필요 없다.”
알파고는 그 다음 착점을 그냥 안다고 한 것입니다 가설 같은 것은 필요가 없다고 한 것입니다.
구글이 시장에서 차세대 인공 지능 기술을 시작하면 주가는 치솟을 것이라고 하고 있습니다
이로 인하여 알파고 기술은 인생을 바꿀 10대 기술로 꼽히게 되었습니다.
구글의 바둑 정복 프로그램 알파고(AlphaGo)에 대한 구글의 발표가 위와 같은 내용이고 그 파장이 위와 같이 매우 큽니다.
알파고(AlphaGo)라는 이름도 아마도 바둑의 새로운 시작이라는 의미로 이 이름을 붙인 것 같고 이만큼 자신이 있어 하는 것 같습니다.
3. 의문의 제기
그러나 저는 이러한 알파고의 성능 및 이론에 대하여 의문을 가지게 되었습니다
제 의문의 근거를 하나씩 설명드리겠습니다.
가. 소프트웨어의 질적 비약적 발전
2-3년 전만해도 바둑두는 사람들과 게임 프로그래머들은 바둑은 너무 복잡하기 때문에 컴퓨터가 인간 전문가를 이기는 데에는 3-4십년 걸릴 것이라고 믿었습니다?
그런데 갑자기 15명이 모인 개발자 그룹에서 전세계 인공 지능 전문가들이 이구 동성으로 말하는 위 기간을 10-30년 단축시켰다는 것입니다.
다른 인공 지능 전문가들이 모두 예측을 잘못한 것입니다.
아니면 알파고 개발 그룹 15명 전부가 희대의 천재들인 것입니다.
그렇지 않고서야 이런 결과가 생긴다는 것은 있을 수 없습니다.
그런데 이러한 가정 모든 인공 지능 전문가들의 예측이 틀렸다는 가정과 15명이 희대의 천재라는 가정 둘 다 심한 의심이 드는 가정입니다.
2014년의 국제 수학자들이 모인 회의에서도 이러한 이야기 들이 오갔습니다.
이어서 '몬테카를로 방법'을 통해 바둑에서 인공지능이 인간과 대결했을 경우 어떤 결과가 나올지 함께 추리해보는 시간을 가졌다. 이교수는 "현재 컴퓨터가 프로기사에게 6점에는 승리할 수 있다. 하지만 5점, 4점에 승리를 거두는 시기가 언제가 될지, 궁극적으로 호선에 승리 할 수 있을지 현재로서는 단언하기 어렵다. 새로운 수학이론이 나와 그것을 실용화 할 수 있는 기회가 온다면 그 시기를 단축시킬 수 있을 것"이라는 전망을 내놓았다.
즉 새로운 수학 이론이 나오기 전까지 4점으로 승리할 시기도 예측할 수 없다는 것입니다.
그런데 구글의 알파고는 새로운 수학이론을 만들지 못하였습니다.
그저 기존의 몬테카를로 기법 등을 쓰고 있다고 하였습니다.
그런데 세계 최고수층에 속하는 Fan Hui를 5:0으로 이겼습니다.
그 중 네 판은 불계승으로 이겼습니다.
수학자들의 전망도 다 틀렸습니다.
바둑은 아래의 숫자만큼의 경우의 수를 가지고 있습니다 이것은 우주의 모든 원자의 숫자 보다 많은 것이고 체스 보다 10의 100승만큼이나 경우의 수가 많습니다 마치 알파고가 체스를 이긴 IBM의 Deep Blue컴퓨터 보다 10의 100승만큼 우수한 것이라고 말했습니다.
There are 1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 possible positions.
현존하는 최고의 인공 지능 시스템인 IBM의 Deep Blue도 간신히 아마추어 바둑선수를 이길 뿐이라고 합니다.
우선 설립자들이 University College London 출신 들인데 이 대학은 물리학 화학으로 유명한 학교이고 컴퓨터 사이언스와는 거리가 멉니다
그런데 컴퓨터 공학과도 유명하지 않은 영국의 대학 출신들이 IBM도 못하는 컴퓨터 기술을 개발해냈다? 의심이 가지 않을 수 없습니다.
IBM은 Watson을 개발하고 판매하는 데 2,000명이 동원되었다고 합니다. 그런데 15명이 IBM의 컴퓨터보다 10의 100승만큼이나 훌륭한 컴퓨터를 개발하였다고 하는 것입니다. 의심이 가지 않을 수 없습니다.
알파고는 점진적 기술 개발이 아니라 거대한 도약이라고 말하고 있습니다
그러나 소프트웨어의 발전에 있어서는 거대한 도약이라는 것은 없습니다 소프트웨어 기술 발전의 역사를 보면 압니다.
구글의 말이라도 믿기가 어려운 것입니다.
지금까지 구글의 컴퓨터 프로그램 중에서 비약적 발전을 한 예가 있습니까?
없습니다.
컴퓨터 프로그램은 그런 것입니다.
아마 과학 자체가 그런 것일 수 있습니다.
아인슈타인의 일반 상대성 원리 같은 비약적인 과학 이론은 100년에 하나 정도 나오는 것입니다.
4. 알파고(AlphaGo) 기술에 대한 의문
가. Value Network와 Policy Network
구글은 알파고 연구를 네이처 지에 표지로 게재하면서 딥 러닝 학계에는 전혀 알려진 바 없는 policy network과 value network이라는 개념을 소개하였습니다.?
그리고 value network은 policy network의 상호 지도에 의해 더 잘 훈련될 수 있다고 설명하였습니다. 그리고 이 기술이 Fan Hui를 이긴 기술이라고 말하고 있습니다
그런데 이 최초의 기술에 대하여 업계의 엔지니어에 의해 의문이 제기되었습니다.
즉 어떤 사람이 value network에 의해 수정되지 않은 원래의 policy network이 모의 실험 결과 구글이 훈련시켜 사용하고 있다는 프로그램 보다 더 좋은 결과를 낸다는 사실을 발견하였습니다.?
구글 측에서는 수정된 policy network에서는 보다 창의적인 움직임이 평균화되어 없어 졌고 최초의 policy network에서는 그러한 창의적인 움직임이 남아있어서 그런 것 같다고 추정하였습니다.
이러한 구글 측의 설명은 훈련이 될수록 성능이 올라간다는 주장과 정면으로 배치되는 것입니다.
전혀 설득력이 없습니다
저는 학계에서 전혀 인정된 바가 없는 value network이나 policy network이라는 개념은 구글이 자신들의 트릭을 숨기기 위해 만들어 놓은 수학적 이론에 근거하지 않은 마케팅적 이론이라고 봅니다
나. 구글은 IBM과는 달리 잠재적으로 유리한 패턴을 찾아서 제한된 가능한 결과만을 시뮬레이션한다고 알려져 있습니다.
이것은 인공 지능에 있어서의 확률이론입니다.
그런데 확률이론이라는 것은 항상 그 확률이 맞지 않는 경우가 있습니다.
인공 지능의 특성은 만일 첫번 째에서 확률에 맞지 않는 일이 일어나면 그 뒤로는 모두 틀리게 됩니다.
이것이 신경망 이론입니다.
그렇다면 만일 알파고가 이세돌 9단이랑 대국할 때 한 판 중 중간에 한번의 실수가 있으면 그 판은 패배합니다.
그런데 Fan Hui와의 대국을 보면 알파고는 한번의 실수도 하지 않습니다.
인공 지능이나 신경망 컴퓨터 이론에 맞지 않는 결과가 나온 것입니다.
그러므로 패턴을 찾아 제한된 것만 시뮬레이션한다는 것은 거짓일 수 밖에 없습니다. 실수가 없는 딥 러닝이란 존재하지 않기 때문입니다.
그런데 FanHui대국을 보면 실수가 하나도 없습니다.
그리고 알파고가 훈련한 방식이 최선이라는 점에 대하여는 아직 논란이 되고 있습니다 딥 러닝(심층 학습)훈련에는 현재 5개의 방식에 대한 학파가 있다고 합니다.
만일 알파고 방식이 가장 훌륭한 것이라면 네이처 지에 이론을 발표할 때 그 이론을 발표하여 다른 학파들의 주장을 봉쇄하였어야 합니다 구글은 그렇게 못하였습니다.
의심이 가지 않을 수가 없습니다.
알파고는 인간의 다음 착점을 57%의 확률로 예측할 수 있다고 하고 있습니다.
이 말은 43%의 경우에는 틀린다는 것입니다.
그리고 신경망 컴퓨터 이론에 의하면 한번 틀리면 그 다음도 그 다음도 틀리게 되어 있습니다. 이것은 FaceBook에서 개발한 바둑 프로그램에서 그대로 나타나고 있는 현상입니다.
그런데 43% 틀리는데 FanHui와의 대국에서는 하나도 틀리지 않습니다.
자신들이 말하는 이론과 실제가 다른 것입니다.
의심이 가지 않을 수 없습니다.
알파고는 이전 기보로 부터의 감독 학습(supervised learning) 과 자신과의 게임으로부터 얻는 강화 학습(reinforcement learning )을 가지고 있다고 합니다.
이것도 실수가 나와야 합니다.
지금의 알파고는 실수가 없습니다.
학습에 의하여만 바둑을 둔다고 할 수 없고 다른 무엇이 있어야 합니다.
구글은 그 “다른 무엇”이 무엇인지를 밝히지 않고 있습니다.
위 딥 러닝 기술만을 가지고 “바둑”을 두고 있다고 하고 있습니다.
다른 사람들도 알파고는 인공지능 컴퓨터가 아니다라고 하고 있습니다.
그럼 인공 지능 컴퓨터가 아니면 도대체 무엇이란 말인가?
구글은 알파고가 인공지능 컴퓨터라고 주장하고 있습니다.
경험으로 볼 때 알파고가 쓰고 있는 Deep Convolutional Neural Network은 바둑 프로그램에 있어서는 전술적으로 약한 모습을 보인다고 하고 있습니다.
그런데 알파고가 FanHui와 대국한 것을 보면 전술이 필요한 중반전에 더욱 강한 모습을 보이고 있습니다. FanHui가 실수하면 가차 없이 응징하여 불계승을 만들어 냅니다. 다섯 판 중 4판에서 그랬습니다.
Deep Convolutional Neural Network(학계에서는 이를 약칭하여 DCNN이라고 합니다)인공 지능 컴퓨터 이론과는 정 반대의 결론을 내고 있는 것입니다.
의심이 가지 않을 수 없습니다.
알파고와 거의 같은 알고리즘을 쓰고 있는 바둑 프로그램인 페이스북의 darkforest는 다음과 같은 약점을 가지고 있다고 합니다
(1)부분 전쟁에서 말을 살리거나 상대방 말을 죽이는 점에 있어서 결정적인 한 수를 두기 못한다.
(2) 부분 전쟁이 필요한 데에도 손을 빼고 다른 곳에 둔다
(3) 쓸모없는 곳에 두면서도 다른 곳에 두는 것이 이길 확률이 매우 높다고 판단한다
(4) 말이 죽었을 때 아주 않좋은 착점이 나오고 그래서 더 많이 진다 전형적인 몬테카를로 서치의 약점이다
그런데 알파고는 거의 같은 알고리즘을 쓰고 있다고 하면서도 이런 현상들이 전혀 없습니다
하늘에서 떨어진 이론 일까요?
의심이 가지 않을 수 없습니다.
인공 지능 바둑 프로그램은 공통적으로 전술적 측면에 약하다 즉 말이 죽었을 때 아주 않좋은 착점이 나오고 그래서 더 많이 진다는 것입니다 신경망 기반의 바둑 엔진에 공통적인 문제라고 합니다
알파고는 신경망 기반의 프로그램이라고 하면서도 이러한 현상이 전혀 없습니다 오히려 전술적으로 더 강합니다. 신경망 컴퓨터에 공통적인 이런 현상을 어떻게 극복하였는지 아무런 이론적 설명도 하지 않고 있습니다.
심한 의심이 생길 수 밖에 없습니다.
구글의 DeepMind 사는 IBM의 Deep Blue와 전혀 다른 알고리즘을 쓰기 때문에 Deep Blue보다 수천분의 일 정도의 계산만 한다고 합니다. 그런데 컴퓨터 자원은 구글 클라우드 슈퍼컴퓨터 농장에 연결하여 컴퓨터 자원을 무한정으로 사용하여 이세돌 9단과 대국하겠다고 합니다.
앞뒤가 맞지 않는 말입니다. 제한된 자원을 가지고도 계산을 더 빨리 해서 다음 착점을 알아낼 수 있다고 주장하면서 왜 더 많은 컴퓨터 자원을 사용하겠다고 하는 것일까요?
앞 뒤가 맞지 않는 이야기 입니다.
또한 알파고는 착점을 중심으로 한 다이아몬드형 패턴만을 사용 하는 “촉진 정책”을 써서 훈련을 시켰다고 합니다 왜 그렇게 했는지 아는 사람이 별로 없습니다’
Pachi라는 컴퓨터 바둑 게임이 있습니다 저우쥔쉰 이라는 대만 프로9단 에게 일곱점 바둑을 이겼습니다. 64대의 슈퍼컴퓨터(즉 한대에 CPU 20개씩 장착)에서 가동되었습니다.
알파고의 value network이라는 기술은 이와 비슷한 것을 평가되고 있습니다.
비슷한 기술인데 하나는 프로에게 7점 바둑을 두고 하나는 이세돌 9단과 호선으로 두어 이기겠다는 것입니다.
하늘에서 떨어진 value network기술인가 봅니다.
하늘에서 기술이 떨어지나요?
의문이 점점 더 깊어 집니다.
알파고는 대만 프로기사에게 일곱점을 접고 바둑을 둔 Pachi를 85%의 승률로 눌렀다고 합니다. 이세돌 9단이 대만 프로기사에게 7점을 두고 두는 하수하고 100번을 두면 과연 15번 질까요??
이세돌 9단 에게 한번 물어 봐야겠습니다 아니면 다른 프로 1단 기사에게 물어 보던지
저도 강일급이어서 고등학교 때에는 프로와 세점 바둑을 두었습니다
제가 프로에게 두 점을 거꾸로 잡아 주면 제가 100판 중 몇 판 이길까요?
저는 한판도 이길 자신이 없습니다.
점점 의심이 깊어 갑니다.
알파고의 특유한 기술이라고 말하는 정책 네트워크(policy network)는 1,000배 빠를지 몰라도 원래의 완전 정책 네트워크 보다는 훨씬 덜 효과적이라고 합니다.
그런데 지금 컴퓨터 자원을 무한정 쓰겠다고 하면서 속도가 빠른 정책 네트워크(policy network)을 쓰겠다고 하는 이유가 무엇일까요?
도대체 앞뒤가 맞지 않습니다.
구글은 16만 대국에서 188개의 뭉치로 이루어진 패턴을 3000만개 추출하여 학습을 시켰다고 주장합니다.
그런데 188개나 되는 뭉치의 패턴이 3,000만개 밖에 없을 까요?
바둑을 아는 사람은 188개로 이루어진 뭉치는 수천억개가 된다는 것을 다 압니다.
10개짜리 뭉치도 아마도 수십억개는 나올 겁니다.
그럼 그 중에 어떤 기준으로 3,000만개를 고른 걸가요?
어떤 패턴이 존재한다는 것일까요
도대체 이해가 안됩니다.
구글이 어떤 이론에 의해 패턴을 찾았으며 그 패턴 중 어떤 방식으로 3,000만개를 선택하여 학습을 시켰는지 그에 대한 이론이나 설명도 전혀 없습니다.
5. 추리
그럼 의문만 제기하지 말고 도대체 정체가 무엇인지 추리를 해 봐야 할 것 아닌가 하는 생각이 드실 겁니다.
제가 아래에서 설명 드리는 것은 추리 수준이 아닙니다.
저는 바둑을 잘 알고 인공 지능 컴퓨터 이론도 상당히 알고 알파고 이론은 전부 독파하여 더욱 잘 압니다.
저는 컴퓨터 소프트웨어 회사를 세계를 설립했고 지금 네번 째 회사도 생각하고 있습니다 그리고 제가 구상하고 있는 프로그램의 모듈 5개 중의 핵심 모듈 두 개는 제가 자바를 새로 배워가면 직접 만들었습니다.
처음 만든 회사는 구글과 같은 일을 하는 회사인데 구글 네이버 보다 3년 일찍 만들었습니다. SoftWise라고 웹 검색해보시면 그 회사가 어떻게 우리나라 초창기 검색시장을 석권하였는지 나옵니다.
그래서 저는 AlphaGo II를 디자인 할 수 있다고 생각합니다.
저 같으면 이렇게 디자인 합니다.
먼저 바둑은 포석, 정석, 중반전, 끝내기로 나눌 수 있습니다.
포석과 정석은 경우의 수가 별로 없습니다.
그냥 어느 포석이 나오면 기보 16만개를 뒤져서 결과가 승리로 나온 것을 학습시키고 나면 그만입니다. (알파고의 policy network과 value network이 그런 역할을 하고 있다고 구글은 설명하고 있습니다)
정석은 기껏해야 10개 정도의 변화 수준입니다. 그대로 입력해도 상관없습니다.
그리고 그 중에서 되도록이면 대형 정석을 상대방이 선택하도록 유도하는 알고리즘을 개발합니다.
중반전은 인공 지능이 약한 부분입니다.
그런데 이세돌 9단이나 이창호 9단 같은 경우에는 포석이 끝나면 그 단계에서 계가를 할 수 있는 능력이 있다고 생각합니다.
이세돌 9단이나 이창호 9단에게 자문을 받아서 포석에서 끝내기로 빨리 갈 수 있는 방법을 연구합니다. 그래서 그 방법을 프로그램화 합니다.
알파고도 프로기사들에게 바둑의 기법을 전수 받아 프로그램을 하였다고 합니다.
끝내기는 수학적으로 해법이 있다는 것이 나와 있습니다.
미국 버클리대서 수학 박사 취득 후 월스트리트를 거쳐 국내서 금융 전문가로 활동 중인 김용환(50) 박사의 '조합게임이론과 바둑'이 있습니다. 바둑 끝내기 이론입니다.
또한 미국의 UC Berkeley대 수학/컴퓨터 공학 교수인 얼윈 벌리캄프(Elwyn Berlekamp, 67세)교수가 있습니다 얼윈 교수는 10개가 넘는 수학관련 특허, 수 십 편의 논문과 저서, 세계적으로 유명한 수학상을 여러 번 수상, 많은 학회와 기업들의 자문위원, Combinatorial Game Theory (조합 게임이론) 분야에서 전세계에서 가장 유명한 교수 중 하나입니다 바둑의 끝내기를 수학적으로 분석한 “Mathematical Go”를 출간하였습니다. Combinatorial Game Theory를 연구하는 전세계의 수많은 연구자들이 바둑이라는 게임에 관심을 갖기 시작했습니다.?
이것도 바둑 끝내기 이론입니다.
바둑의 끝내기는 완벽한 해답을 수학적으로 풀 수 있다는 이론입니다.
수학으로 풀 수 있으면 컴퓨터로 프로그래밍할 수 있습니다.
끝내기는 프로기사들 모두 공통적으로 인정하는 규칙이 있고 또 경우의 수가 많지 않기 때문에 완벽한 프로그램을 할 수가 있다고 봅니다.
그러므로 어떡하면 중반전의 변화를 최소화하고 포석 단계에서 빠른 시기에 끝내기 단계로 들어가게 할 수 있을 것인가가 바둑 프로그램의 핵심이라고 봅니다. 대신 이런 프로그램과 두는 바둑은 완전히 재미없어 집니다. 재미라는 바둑의 본질에서 멀어집니다.
그런데 알파고는 이렇게 까지는 못한 것 같습니다.
그래서 중반전을 치르게 되어 있습니다.
아마도 되도록이면 중반전이 길지 않도록 프로그램 되어 있을 것이 분명합니다. 인공 지능은 중반전에 약하기 때문입니다.
그러면 중반전을 어떻게 처리하여 FanHui를 이기고 이세돌 9단을 이긴다는 것일까?
구글 직원과 알파고를 만든 Demis Hassabis가 어떻게 하는 지를 자백하였습니다.
구글에 있는 엔지니어가 쓴 글에 의하면 이렇습니다.
구글의 알파고는 자원을 많이 투입할수록 정확도가 높아지게 설계가 되어 있다.
다른 일반적인 인공지능 바둑 프로그램은 컴퓨터 자원을 투자하면 더 빨라는 져도 더 정확해 지지는 않는다.
알파고가 만일 첫판을 지면 컴퓨터 자원을 두 배로 늘리면 이길 가능성이 많이 높아지고 만일 두 번 째 판도 지면 컴퓨터 자원을 열 배로 늘리면 무조건 알파고가 이긴다 그러면 처음부터 구글이 가지고 있는 전세계 컴퓨터 자원을 총 동원하면 이세돌 9단은 한판도 못이기는 것이다
아마도 이세돌 9단과의 대국에서는 알파고가 Fan Hui를 이겼을 때의 자원의 두 배 정도의 컴퓨터 자원을 첫판에 투입하지 않을까 생각됩니다 그 정도만 해도 이세돌 9단을 충분히 이길 수 있을 거라고 생각됩니다.?
그럼 어떤 알고리즘을 사용하였을까요?
앞에서 말씀드린 바와 같이 이 대국은 구글에게는 수조의 돈과 회사의 명예가 걸려 있기 때문에 반드시 이겨야 합니다.
반드시 이기는 알고리즘은 세상에서 하나 밖에 없습니다.
IBM이 체스 챔피언을 이길 때 사용한 알고리즘입니다.
Brute force라고 합니다.
중반전에는 이 알고리즘을 사용할 수 밖에 없습니다. 이 알고리즘은 100% 경우의 수를 다 탐색하기 때문에 지는 경우가 없습니다. 물론 끝내기 전 까지만 이 알고리즘을 동원하면 됩니다. 끝내기는 컴퓨터가 완벽하게 할 수 있고 끝내기에서 이세돌 9단이 유리해 지는 경우는 없습니다. 포석, 정석에서도 이세돌 9단이 유리해 질 수가 없습니다.
중반전이 이세돌 9단이 유리해 질 수 있는 유일한 시점인데 알파고에게는 중반전에서 완벽하게 이기는 알고리즘이 있습니다.
그래서 구글은 100% 승리하게 되어 있습니다.
컴퓨터 자원이 좀 필요하죠.
그래서 구글의 Demis Hassabis가 이세돌 9단과의 대국장까지 광케이블을 현재 깔고 있는 것입니다.
5. 바둑 규칙 위반
그러면 이러한 상황에서 바둑의 규칙을 살펴 봅니다.
첫째 이 경기는 훈수를 두어서는 아니 된다는 바둑 원칙에 어긋납니다
훈수가 무엇인가? 그것은 대국 당사자도 아니면서 착점에 대하여 언급하는 것입니다.
누가 대국 당사자인가?
이세돌 9단과 알파고입니다.
제가 위에서 말씀 드린 바와 같이 중반전에는 brute force 알고리즘을 쓸 수 밖에 없습니다. 그런데 구글은 알파고가 brute force 알고리즘을 절대로 쓰지 않는다고 천명해 왔습니다. 그러므로 brute force 알고리즘을 쓰는 컴퓨터는 다른 프로그램이고 다른 프로그램이 알파고의 훈수를 두고 있는 것입니다.
brute force 알고리즘이외에도 이를 본뜬 다른 알고리즘도 있습니다?
그러나 구글은 알파고에서 그런 알고리즘을 전혀 쓰지 않고 있다고 하고 있습니다.
이것은 반칙입니다.
광케이블로 인터넷에 연결하여 바둑을 두겠다는 것은 무제한의 국외자 훈수꾼 들을 둘 수가 있습니다.?
이 점에 대하여 어떤 이는 말합니다. 구글이 허위의 사실을 말했다고는 도저히 생각할 수 없다.
저는 막대한 돈과 명예 앞에 그리고 성과 위주의 기업 환경하에서 구글의 직원들이 어떠한 트릭도 쓰지 않을 것이라고 믿지 않습니다. VolksWagen 예를 보십시요 누가 VolksWagen이 그런 일을 할 것이라고 생각한 사람이 있었습니까?
그러나 정말 터무니 없는 간단한 소프트웨어 사기가 일어났습니다.
구글에서 이러한 소프트웨어 사기가 일어나지 않으리라는 보장은 없습니다.
이 게임은 공정하지 않습니다
둘째 이 경기는 바둑은 일 대일 대결이라는 바둑 원칙에 어긋납니다.
컴퓨터 자원을 무제한으로 쓸 때 과연 하나의 알파고는 무엇을 의미하는가 의문이 없을 수 없습니다. 하나의 알파고인가 만대의 알파고 인가? 컴퓨터 바둑 프로그램에서 하나의 선수란 과연 무엇을 의미하는 것인가?
이런 것들을 먼저 검토해 보아야 합니다.
그리고 명백히 brute force 알고리즘을 쓰는 프로그램은 또 다른 하나의 프로그램입니다. 이세돌 9단 한 명과 최소한 두 개의 프로그램이 대결하는 것입니다.
바둑 규칙에 어긋납니다.
그 동안 인공지능 전문가들이 컴퓨터가 바둑을 정복하는데 10년이 더 걸릴 것이다라고 예측한 것은 단일한 컴퓨터를 상정한 것입니다. 이론적으로 만일 구글이 무한정의 컴퓨터 자원을 사용하면 아주 허접한 인공 지능만 있어도 모든 경우의 수를 다 계산해 낼 수 있습니다.
체스 챔피언을 꺾은 IBM Deep Blue는 단일한 컴퓨터였습니다.
즉 기존에 말하여지던 다른 인공 지능들은 먼저 학습을 하고 그 결과를 가지고 하나의 컴퓨터에서 의사결정을 하는 것입니다
구글이 지금 제안하는 것은 실시간으로 변하는 상황에 맞추어 컴퓨터 프로그램을 실시간으로 다시 훈련을 시킨다는 것입니다.
광케이블로 인터넷(소위 구글 클라우드 팜)에 연결시켜 바둑을 둔다는 것은 인공지능 용어로는 실시간으로 새로운 학습과 새로운 의사결정을 할 수 있다는 의미입니다. 즉 이미 훈련 시킨 수십 수백대의 알파고를 이세돌 9단이 둔 수를 기초로 실시간 다시 학습시키면서 동원할 수도 있다는 것으로 해석됩니다.
기존의 정통적인 인공지능의 의미에서 볼 때 이것은 인공지능이 아닙니다. 학습에 의해 상대방의 수를 예측하면서 두는 것이 아니라 이미 둔 수를 보고 나서 그 다음 수를 계산하겠다는 것입니다.
이렇게 하면 경우의 수가 현저하게 줄어듭니다.
이것은 기존의 인공 지능 개념에서 멀어 져도 너무 멀어 져서 사람들이 인공 지능에 대한 개념을 송두리째 바꾸어야만 합니다.
제가 누차 말하였듯이 게임은 게임의 규칙을 정하는 게임 제시자가 이기고 게임의 룰을 바꾸면 이를 바꾸는 사람 측에 승산이 생깁니다.
제가 23년 전에 컴퓨터의 가장 이상적인 형태는 광케이블과 슈퍼 컴퓨터가 연결되는 것이라고 말한 사실이 있습니다.?
그리고 23년이 지나서 구글이 이세돌 대결에서 슈퍼컴퓨터 농장과 광케이블을 연결 시키는 꿈의 컴퓨터 방식을 동원하겠다고 하는 것입니다.
더 치명적인 가능성도 있습니다.
그 연결된 수많은 컴퓨터 중에 프로5단 짜리 한 명의 사람이 조정하는 컴퓨터가 있을 수도 있습니다. 구글의 클라우드 팜에는 수천대 수만대의 슈퍼 컴퓨터가 연결되어 있습니다 그 중 하나를 누군가 인간이 조정할 수도 있습니다.
구글을 믿으라고 합니다. 그러나 VolksWagen 같은 세계적인 회사 아마도 구글만큼이나 유명한 회사도 사기를 칩니다.
구글을 무조건적으로 믿을 수는 없습니다.
제가 말하는 일이 왜 일어날 수 없는지 그리고 그러한 방안이 무엇인지 그 대책을 어떻게 세워 놓았으며 어떻게 실행할 것인지 모두 설명해야 합니다.
그러나 그렇게 다 한다고 하여도 그런 일이 일어나지 않았다는 사실을 누가 증명을 할 수 있을 까요??
부존재의 증명은 법학에서 "악마의 증명"이라고 하고 있습니다. 즉 증명 불가라는 것입니다 구글은 전세계 바둑인들의 의심이 사실이 아님을 증명할 수 없습니다.
셋째 이 경기는 시간 제한 규정을 불공평하게 일방적으로만 적용하게 되어 있습니다.
시간 제한 규정이 의미가 없습니다?
광케이블에 연결된 인터넷에 연결되는 순간 알파고는 사실상 무한정의 시간을 가지게 되고 이세돌은 시간 제한을 받게 됩니다.
이것이 부당하다는 것은 쉽게 이해가 되실 것이라 생각합니다.
지금 DeepMind의 AlphaGo는 Atari 아케이드 게임 59개 중에 27개를 못이기는 허접한 것입니다. 그리고 자신들이 네이처 지에 쓴 논문에 이러한 승률을 밝혔습니다
바둑은 제가 생각하기에는 아케이드 게임 보다 훨씬 어려운 것인데 알파고가 아케이드 게임에게는 지고 바둑은 전승하는 이유를 알 수가 없습니다.
또 요즈음 가장 빈번하게 문제를 일으키는 경우는 초읽기입니다.
대국시간 불준수로 패하는 경우가 상당히 있습니다 그런데 광케이블로 인터넷에 연결하여 바둑을 두면 알파고는 무한정 동시에 수천대의 알파고를 돌릴 수 있기 때문에 시간 패를 당할 가능성이 전혀 없습니다 시간이 부족하면 전세계에 있는 다른 컴퓨터들을 얼마든지 동원할 수 있습니다.
반면 이세돌은 혼자 두기 때문에 시간 패를 당할 수 있습니다
.
이는 공평하지 않은 게임입니다.
저는 이 대국이 의미가 없다고 생각합니다. 인공 지능의 우수성을 증명하는 효과도 없고 불공평하기 이를 때 없습니다.
공연히 남의 회사의 매우 misleading한 기술 광고에 놀아나는 꼴이 됩니다
외국에서는 이 대결을 DeepMind v. Korea at Blood War라고 하고 있어 우리나라까지 광고에 동원되고 있습니다
결론?
구글의 행동은 아래에 해당합니다
“사기는 말이나 행동으로 또는 거짓이거나 오해스러운 언동으로 또는 마땅히 공개하였어야 할 것을 숨김으로써 다른 사람을 속이는 것”
오해스러운 언동에 의해 사기의 경우에는 정보의 비대칭성이 중요하게 작용합니다 즉 일방 당사자가 우월한 지식을 가지고 있을 때에는 쉽게 사기가 인정됩니다
구글은 일반인들이나 심지어는 인공 지능 전문가들도 모르는 방법을 동원하였으므로 정보의 비대칭성이 있고 또 우월한 지식을 가지고 있음에 틀림없습니다.
피해자가 오해스러운 언동을 한 당사자에게 신뢰를 가지고 있을 경우 특히 그렇습니다.
전세계에서 구글 만큼 사람들의 신뢰를 받는 기업은 없습니다?
여기에도 해당됩니다.
침묵도 사기가 될 수 있습니다
구글은 제가 제기한 의문 중 어느 하나도 설명한 바가 없습니다 침묵에 의한 기망이 됩니다.
우리의 자랑 조치훈 기사는 바둑을 대하는 태도에 있어서 “나는 목숨을 걸고 둔다”라고 진지하게 말했습니다. 바둑은 인간의 영혼이 담긴 게임이라고 생각합니다.
구글은 바둑을 경우의 수의 무한 조합 계산에 의한 게임으로 생각하고 터무니 없는 방법으로 전세계 바둑인들을 놀라게 하려고 하고 있는 것입니다.
구글은 Fan Hui에게도 사과하여야 하고 이세돌 9단을 바둑 규칙을 어겨가면서 이기겠다고 한 그 시도 자체로도 사과하여야 한다고 생각합니다.
사과의 대상은 위 두 프로기사뿐 아니라 전세계 모든 바둑인을 상대로 하여야 합니다.
구글은 2600년 동안 인간만이 두어 왔던 훌륭한 게임인 바둑을 모욕하였습니다.?