|
2023년 '공전의 Chat GPT 붐'에 이르기까지의 AI 역사와 향후 진화의 향방 / 12/29(금) / 현대 비즈니스
◎ 2023년은 AI 보급 원년
2023년은 장기화하는 러시아/우크라이나 전쟁과 하마스 기습공격에서 비롯된 이스라엘군의 가자 침공 등과 함께 세계적으로 AI(인공지능)가 처음으로 일반사회에 보급된 해로 기억될 것이다.
2022년 11월 말 어느 쪽인가 하면 조용하게 출시된 'Chat GPT'는 이듬해 23년 봄경부터 전 세계적으로 폭발적인 붐을 일으켰다.
당초 ChatGPT는 우리 인간의 말을 이해하고 교묘하게 말을 조종하는 한편, 그 대답에는 종종 정보의 오류나 조작, 혹은 인종·성적 편견 등의 문제들이 보였다.
그러나 Chat GPT의 기반이 되는 대규모 언어 모델(LLM)이 최신 GPT-4로 전환될 무렵부터 서서히 그 문제들은 해결되어 갔다.
이제 우리가 삼라만상, 모든 방면의 질문을 던져도 대체로 적절하고 조리 있는 답을 돌려준다. 커버하는 지식의 범위(넓이)라는 점에서 Chat GPT는 이미 인간의 능력을 훨씬 넘어섰다고 봐도 무방할 것이다.
이러한 첨단 AI가 지금의 페이스로 발달하면, 이른바 「AGI(인공 범용 지능)」나 「싱귤러리티」등으로 불리는 역사적인 전환점이 예상보다 빨리 오지 않을까 ―― 그런 견해도 항간에서 수근거리게 되었다.
향후 AI의 진화 속도와 방향성을 점치는 데 현대 AI의 역사를 간단히 되돌아보는 것은 유익할 것이다. 그 앞으로 미래로 향하는 AI의 모습이 떠오르기 때문이다.
◎ AI(딥러닝) 열풍의 시작
AI의 역사는 1956년 미국 다트머스 회의까지 거슬러 올라가지만, 실제로는 최근 10년 정도의 역사[그림1]에 한해 보면 충분할지도 모른다. 확실히 AI는 전체적으로 70년 가까운 역사를 가지고 있지만, 이 기술이 본령을 발휘하기 시작한 것은 비교적 최근의 일이기 때문이다.
ChatGPT와 같은 현대 AI는 일반적으로 '뉴럴넷'으로 불리는 종류의 것으로 대체로 '인간 등 동물의 뇌를 참고한 인공지능'이라는 이해가 맞다.
신경망은 1950년대 탄생한 매우 오래된 AI 기술이지만 2000년대 초반까지 큰 성과를 내지 못했다. 마침내, 그 잠재적인 능력이 (적어도 AI 연구자 등 전문가 사이에서) 인지되기 시작한 것은 2000년대 후반~2010년대의 일이다.
당시 제프리 힌튼 캐나다 토론토대 교수 연구실에 우크라이나 출신 알렉스 클리제프스키와 러시아 출신 일리야 스투케버라는 두 AI 연구자(대학원생)가 소속돼 있었다.
힌튼은 좀처럼 싹이 트지 않는 신경망 연구를 1970년대부터 줄기차게 이어가 이제는 'AI계 대부'로 불리는 고참 연구자다.
한편 클리제프스키는 힌튼이 "내가 평생 만난 것 중 아마 최고의 컴퓨터 프로그래머"라고 극찬할 정도의 프로그래밍 달인이다. 또 스투케버도 자신 전용 프로그래밍 언어를 단독 개발해 버릴 정도의 뛰어난 해커다.
이들은 2010년경 엔비디아제의 그래픽 카드 'GeForce'를 'CUDA'라고 불리는 병렬 계산 플랫폼 상에서 가동시키면 신경망의 처리 속도(엄밀하게는 학습 속도)가 기존 CPU(중앙 연산 장치)를 사용했을 때보다 약 100배 높아진다는 것을 발견했다.
이 GeForce와 같은 그래픽 카드[그림2]는 일명 'GPU(Graphics Processing Unit)'라고도 불리며, 당시에는 비디오 게임의 처리 속도를 높이기 위해 고급 게이머들에 의해 구입되었으며 주로 게임용 PC에 내장되어 사용되었다.
[그림 2] GPU 이미지 화상
이 GPU는 개당 수천달러(수십만엔)로 비싸기 때문에 대학 연구실에서도 그렇게 많이 구입할 수는 없다.
2012년 클리제프스키와 스투케버는 단 2개의 GPU를 사용해 다층 구조의 신경망을 개발했다. 이는 개발자의 이름(Alex Krizhevsky)을 따서 'AlexNet'으로 명명되었다. 알렉스넷은 스탠퍼드대 연구자들이 주최하는 세계적인 화상인식 콘테스트에서 2위 이하를 압도적 큰 차이로 따돌리는 좋은 성적을 거두며 우승했다.
이들이 이들 연구 성과에 대해 정리한 논문 "ImageNet Classification with Deep Convolutional Neural Networks"는 다른 AI 연구자들로부터 족히 10만회 이상 인용되는 등 컴퓨터 과학 역사상 가장 중요한 논문 중 하나로 꼽히고 있다.
이후 음성·영상 등 패턴 인식을 하는 AI 연구개발은 GPU를 채용한 다층 신경망 일색으로 도배됐다. 또한 그로 인한 기계학습은 '딥러닝(심층학습)'이라고 불리게 되었다.
딥러닝을 통한 이미지 인식 시스템은 모두 황갈색 모피에 검은 반점이 있는 사바나 포식동물 '레퍼드(표범)'와 '치타'처럼 헷갈리는 이미지[그림3]를 보여줘도 96% 이상 확률로 올바르게 둘을 식별할 수 있게 됐다. 이것은 우리 인간을 능가할 정도의 화상 인식 능력이다.
[그림3] 왼쪽이 레퍼드, 오른쪽이 치타
이 업적은 전문가들 사이에서 'AI가 처음 눈을 가졌다'는 비유로 높이 평가됐다. 모든 인지기능의 기초가 되는 「시각」을 실현함으로써, 그 동안 큰 성과를 내지 못했던 신경망, 즉 AI의 전도에 지대한 희망을 안겨주는 결과가 되었다.
이 성공에 주목한 구글이 힌튼과 클리제프스키, 스케버 등 연구실 멤버들을 통째로 제치고 자사 AI 연구개발에 나섰다. 이에 따라 이들 연구자는 각각 최소 수 백만달러(수 억엔)의 보수를 챙긴 것으로 보인다.
이 같은 구글의 움직임을 본 페이스북(현재 메타)도 그에 못지않은 고액의 보수로 힌튼에 버금가는 고명한 AI 연구자 얀 루칸을 자사에 신설한 AI 연구소 소장으로 초빙했다.
곧 앤드리센·홀로위츠 등 눈치 빠른 실리콘밸리 VC(벤처캐피털)들이 속속 창업한 AI 개발 스타트업에 투자를 시작했다.
이렇게 그동안 대학 등 연구자 커뮤니티에 머물던 AI에 산업계가 주목하면서 그 연구개발에 거액의 자금이 흘러들게 됐다. 이것이 현재 딥러닝, 나아가 AI 열풍의 시작이다.
◎ AI의 경이로운 진화를 각인시킨 바둑·장기 승리
당시 구글은 힌튼을 비롯한 토론토대 출신 연구자들을 '구글 브레인'으로 불리는 AI 연구부문에 배속했다.
그러면서도 이와 별도로 2014년 영국 AI 스타트업 '딥마인드'를 추정 6억 달러(600억엔 이상)에 인수해 (상당한 독립성을 유지한 형태로) 구글 산하 기업으로서 역시 첨단 AI 연구개발에 임했다.
즉 구글에는 당시 최소 2개의 AI 연구 부문이 존재한 셈이다.
딥마인드 공동창업자 중 한 명으로 이 회사 CTO(최고기술책임자, 당시)의 데미스 하사비스는 소년 시절에는 '체스 신동'으로 알려져 14세 이하 플레이어 중 세계 2위에 오르기도 했다.
그는 자신의 탄생지 런던의 중고교를 월반해 16세에 졸업하자 현지 게임업체에서 개발자로 일하기 시작했다. 이후 스스로 게임 개발사를 창업·경영한 뒤 케임브리지대와 런던대에서 공부했고, 그곳에서 신경과학(뇌과학) 연구에 몰두했다. 이후 2010년 AI 연구자 무스타파 슬레이먼, 쇤 레그 등과 공동으로 딥마인드를 창립했다.
하사비스는 이미 15, 6세 무렵에는 '나는 장차 AI 연구자가 되겠다'는 것을 결의했었다. 체스 신동시대를 포함해 게임업체 개발자, 뇌과학자 등 다채로운 경력은 모두 결국 AI 연구에 활용하기 위해서였다고 한다.
왜, 지극히 젊은 나이에 AI 연구자를 목표로 했을까? 그 동기에 대해 하사비스는 다음과 같이 말하고 있다.
"나는 중고교 시절 물리학을 무척 좋아했고 (양자전자역학 연구로 노벨상을 받은) 리처드 파인먼이나 (전약통일이론으로 똑같이 노벨상을 받은) 스티븐 와인버그 등은 나의 영웅이었다.
그런데 자세히 그들의 업적을 살펴보니 오랜 물리학 역사 전체로 보면 큰 진보를 이루지 못하고 있음을 깨달았다. 즉 인간의 능력만으로는 파인만 등 놀라운 천재 같은 사람들도 할 수 있는 일에는 한계가 있다는 것을 알게 된 것이다.
그래서 나는 물리학자가 아닌 AI 연구자가 되기로 결심했다. 스스로 개발한 고도의 AI를 과학자를 지원하는 도구로 사용할 수 있다면 물리학 나아가 자연과학 전체에 무한한 진보를 가져올 수 있다고 생각했기 때문이다."
이런 말을 들으면 하사비스는 머리가 급한 이상주의자라는 인상을 받지만 실제로는 그렇지도 않은 듯하다.
그는 실리콘밸리에서 쌓은 연줄을 의지해 피터 틸의 버티에 초대받자 이 저명 투자자를 능수능란하게 설득해 딥마인드 창업자금을 대주는 등 의외로 현실적이고 세상 물정에 능한 일면도 갖췄다.
이런 하사비스의 현실적인 자세는 그의 연구주제 선택에도 활용되고 있다.
2010년 딥마인드를 공동 창립한 직후부터 2014년 이 회사를 구글에 인수되기까지 수년간 하사비스 등은 1970년대 유행했던 탁구게임 '펑(Pong)' 등 고전적 비디오게임을 자동으로 플레이하는 AI 연구개발에 몰두했다.
왜 이런 연구 주제를 굳이 선택했을까? 그 이유에 대해 하사비스는 다음과 같이 말했다.
"당시 첨단 AI 연구자들이 즐겨 선택하는 주제에는 (공장이나 창고에서 인간과 공동 작업하는 휴머노이드 등) 고도의 AI를 탑재한 자율형 로봇 등이 있었다. 그러나, 이러한 로봇의 부품은 모두 고액으로, 그 구조는 복잡하고, 그 동작은 둔하다. 또한 로봇은 종종 고장이 나거나 부서져 버린다.
즉 로봇처럼 현실 세계, 혹은 물리적 세계를 상대로 한 기술은 연구 주제로서 (성과를 내기가) 매우 어렵다고 느꼈다. 그보다 오히려 (현실 세계의 물리적 장애와는 무관한) 시뮬레이션을 선택해야 한다고 생각했다.
비디오 게임은 시뮬레이션의 일종인 동시에 내가 16살 때부터 연구개발에 몰두해 온 기술인 만큼 충분한 지식과 경험도 축적하고 있다. 처음에는 '퐁'처럼 초보적인 게임부터 시작해 결국 스타크래프트 같은 고도로 복잡한 게임까지 AI로 자동 플레이할 수 있게 됐다.
지금 돌이켜보면 이 비디오 게임이라는 연구 주제야말로 첨단 AI 알고리즘을 연구 개발하는 데 가장 효율적인 길이었다고 생각한다."
급기야 구글에 인수된 딥마인드는 이들 게임 AI 연구로 기른 '딥러닝'과 '강화학습' 등 첨단 기술을 바둑에 응용해 2014년 '알파고' 로 불리는 바둑 AI 소프트웨어를 개발했다.
알파고는 2016년 그동안 바둑 세계 타이틀을 통산 16차례나 획득한 톱기사 한국의 이세돌을 4승 1패로 물리쳤고, 이듬해 2017년에는 당시 '인류 최강 기사'로 꼽혔던 중국의 가제츠를 3전 전승으로 물리쳤다.
일본에서도 야마모토 가즈나리를 메인으로 개발된 장기 AI 소프트웨어 '포난자'가 2017년 당시 사토 아마히코 명인에게 승리하는 등 바둑과 장기 같은 전통 보드게임은 첨단 AI의 경이로운 실력을 일반인들에게 알릴 수 있는 멋진 기회가 됐다.
이에 따라 2012년경 시작된 세계적인 AI 열풍이 결정적인 것으로 사람들의 뇌리에 박히게 된 것이다.
◎ ChatGPT 붐을 거치며 기호 접지 문제 도전
이후 하사비스 등이 이끄는 딥마인드는 알파고 개발로 쌓은 고도의 AI 기술을 분자생물학 분야에 응용해 2018년 단백질 구조를 예측하는 '알파폴드'라 불리는 학술적 도구를 개발했다. 이는 말 그대로 단백질을 구성하는 아미노산 배열의 접히는 구조를 딥러닝을 통해 예측하는 시스템이다.
이 같은 첨단 AI의 자연과학 응용은 본래 하사비스가 지향했던 것이기도 하고 알파폴드가 새로운 단백질의 존재를 계산과학적으로 예언하는 시스템으로 분자생물학자들에 의해 편리해지고 있는 것도 사실이다.
그러나 과학자 이외의 일반인들이 볼 때 알파폴드와 같은 학술적 AI는 분명 중요하다는 것은 알면서도 일상생활에 비춰 별로 감이 오지 않았다.
알파고가 이세돌 등 바둑 세계적 강호들을 타파할 당시 종종 TV와 신문 등 국제 보도를 떠들썩하게 했던 천재 하사비스지만 이후에는 주요 매체에 등장할 기회가 눈에 띄게 줄었다. 이로 상징되듯 세계적인 AI 열풍은 일종의 '중권태기'에 접어들었다.
하지만 이 기간에도 딥러닝과 같은 첨단 AI를 뒷받침하는 계산 인프라 정비는 착착 진행됐다. 창업 초기 게임용 그래픽보드 제조사였던 엔비디아는 어느새 거대한 AI 반도체 제조사로 성장했고, 'A100'으로 대표되는 초고속 신형 GPU를 속속 개발·상품화했다.
이 무렵 세계적으로는 아직 무명의 AI 스타트업 오픈AI가 이들 초고속 GPU를 다수 채용해 'GPT' 혹은 '대규모 언어모델(LLM)'로 불리는 신종 AI 개발을 물밑에서 진행해 나갔다.
참조) 샘 알트먼의 'Open AI'는 어떻게 태어나 진화해 앞으로 어디로 향하는가? [제1회]
이 LLM을 기반으로 하는 대화형 AI '챗 GPT'가 2022년 11월 말 출시되자 그 유창한 언어 능력과 놀라운 박식 등으로 순식간에 세계적인 붐을 일으켰다.
LLM의 상품화로 오픈AI에 추월당한 구글은 한때 사내적 혼란 양상을 보였지만 이내 태세를 고쳐 추격을 시도했다.
이 회사는 2023년 들어 구글 브레인과 딥 마인드라는 두 AI 연구 부문을 통합해 구글 딥 마인드로 불리는 연구소로 단일화했다. 그 리더로는 하사비스가 임명되었다. 즉 그는 구글이 하는 AI 연구개발을 모두 지휘하는 입장이 된 것이다.
같은 해 12월 구글(·딥마인드)은 언어, 영상, 음성 등 다양한 종류의 데이터를 처리할 수 있는 멀티모달 형태의 LLM '제미니'를 선보였다. 다양한 인식 기능을 획득함으로써 이 AI에는 일종의 추론 능력도 길러졌다고 한다.
유튜브에 올라온 뮤직비디오에서는 제미니가 공력 저항이 작은 유선형 자동차가 각진 디자인의 자동차보다 고속으로 이동할 것으로 예측하는 등 추론 능력의 편린을 내비쳤다.
그가 이끄는 구글 딥마인드는 향후 제미니를 로봇에 탑재하는 등 이 AI가 물리적 현실 세계와 상호작용할 수 있도록 하는 것을 목표로 하고 있다.
이에 따라 소위 "기호 접지 문제(Symbol grounding problem)"라고 불리는 고전적인 난문제를 해결하고자 한다.즉 LLM이라는 '몸이 없는 AI'가 로봇의 신체를 빌려 현실 세계를 실체험함으로써 '말'이라는 기호의 의미를 체감할 수 있게 한다는 것이다.
지난 2010년 영국에서 딥마인드를 공동 설립한 당초 현실 세계의 여러 물리적 장애를 신중히 고려해 오히려 비디오 게임과 같은 시뮬레이션 AI 연구부터 시작한 하사비스지만 이번에 만반의 준비를 통해 그 틀을 깨고 현실 세계를 상대로 한 로봇 AI 개발에 나서게 된다.
그 앞길에는 이제 최대 경쟁자가 된 OpenAI가 지향하는 것과 같은 'AGI(인공범용지능)'의 모습이 어른거린다.
코바야시 마사카즈(작가·저널리스트)
https://news.yahoo.co.jp/articles/f55e99fbdf1e28febbdae82ea3de9381eb9043f7?page=1
2023年「空前のChatGPTブーム」に至るまでのAIの歴史と今後の進化の行方
12/29(金) 6:04配信
現代ビジネス
2023年はAI普及元年
Gettyimages
2023年は長期化するロシア/ウクライナ戦争やハマスの奇襲攻撃に端を発するイスラエル軍のガザ侵攻などと並んで、世界的にAI(人工知能)が初めて一般社会に普及した年として記憶されるだろう。
【写真】天才・アルトマンを死守した「OpenAI社員の思惑」と「生成AIバブル」
2022年11月末、どちらかと言えばひっそりとリリースされた「ChatGPT」は、翌23年の春頃から世界中で爆発的なブームを巻き起こした。
当初、ChatGPTは私たち人間の言うことを理解して巧みに言葉を操る一方で、その回答にはしばしば情報の誤りや捏造、あるいは人種・性的偏見などの諸問題が見受けられた。
が、ChatGPTのベースとなる大規模言語モデル(LLM)が最新のGPT-4に切り替わる頃から、徐々にそれらの問題は解決されていった。
今では私たちが森羅万象、あらゆる方面の質問を投げかけても、概ね適切で筋の通った答えを返してくる。ことカバーする知識の範囲(広さ)という点では、ChatGPTはすでに人間の能力を遥かに超えていると見ていいだろう。
こうした先端AIが今のペースで発達すれば、いわゆる「AGI(人工汎用知能)」や「シンギュラリティ」などと呼ばれる歴史的な転換点が予想以上に早く訪れるのではないか――そんな見方も巷間囁かれるようになってきた。
今後のAIの進化速度や方向性を占う上で、現代AIの歴史を簡単に振り返ってみることは有益だろう。その行く先に、未来へと向かうAIの姿が浮かび上がってくるからだ。
AI(ディープラーニング)ブームの始まり
AIの歴史は1956年の米国ダートマス会議にまで遡るが、実際にはここ10年程の歴史(図1)に限って見れば十分かもしれない。確かにAIは全体で70年近くの歴史を有するが、この技術が本領を発揮し始めたのは比較的最近のことであるからだ。
図1)現代AI史のマイルストーン
ChatGPTのような現代AIは一般に「ニューラルネット」と呼ばれる種類のもので、概ね「人間など動物の脳を参考にした人工知能」という理解で間違いない。
ニューラルネットは1950年代に誕生した非常に古いAI技術だが、2000年代前半まで大した成果を出すことができなかった。ようやく、その潜在的な能力が(少なくともAI研究者など専門家の間で)認知され始めたのは2000年代後半~2010年代のことである。
当時、カナダ・トロント大学のジェフリー・ヒントン教授の研究室に、ウクライナ出身のアレックス・クリジェフスキーとロシア出身のイリヤ・スツケヴァーという二人のAI研究者(大学院生)が所属していた。
ヒントンは中々芽が出ないニューラルネットの研究を1970年代から粘り強く続け、今では「AI界のゴッドファーザー」と呼ばれる古株の研究者だ。
一方、クリジェフスキーはヒントンが「私が生涯に出会った中で、恐らく最高のコンピュータ・プログラマー」と絶賛するほどのプログラミングの達人だ。またスツケヴァーも自分専用のプログラミング言語を単独開発してしまうほどの凄腕ハッカーである。
彼らは2010年頃、Nvidia製のグラフィックス・カード「GeForce」を「CUDA」と呼ばれる並列計算プラットフォーム上で稼働させると、ニューラルネットの処理速度(厳密には学習速度)が従来のCPU(中央演算装置)を使った場合よりも約100倍に高まる事を発見した。
このGeForceのようなグラフィックス・カード(図2)は別名「GPU(Graphics Processing Unit)」とも呼ばれ、当時はビデオゲームの処理速度を上げるためにハイレベルのゲーマーらによって購入され、主にゲーム用のパソコンに組み込まれて使われていた。
図2)GPUのイメージ画像
このGPUは一個数千ドル(数十万円)と高額なので、大学の研究室でもそう沢山購入するわけにはいかない。
2012年、クリジェフスキーとスツケヴァーはたった2個のGPUを使って多層構造のニューラルネットを開発した。これは開発者の名前(Alex Krizhevsky)にちなんで「AlexNet」と命名された。AlexNetはスタンフォード大学の研究者らが主催する世界的な画像認識のコンテストで、二位以下を圧倒的大差で引き離す好成績を上げて優勝した。
彼らがこれらの研究成果についてまとめた論文“ImageNet Classification with Deep Convolutional Neural Networks”は他のAI研究者達から優に10万回以上も引用されるなど、コンピュータ科学史上で最も重要な論文の一つに挙げられている。
これ以降、音声・画像などのパターン認識を行うAIの研究開発は、GPUを採用した多層ニューラルネット一色に塗り潰された。また、それによる機械学習は「ディープラーニング(深層学習)」と呼ばれるようになった。
ディープラーニングによる画像認識システムは、ともに黄褐色の毛皮に黒い斑点のあるサバンナの捕食動物「レパード(豹)」と「チーター」のように紛らわしい画像(図3)を見せられても、96パーセント以上の確率で正しく両者を識別できるようになった。これは我々人間を凌ぐほどの画像認識能力である。
図3)左がレパード、右がチーター
この業績は専門家の間で「AIが初めて目を持った」という比喩で高く評価された。あらゆる認知機能の基礎となる「視覚」を実現したことで、それまで大した成果を出すことが出来なかったニューラルネット、つまりAIの前途に多大な希望を抱かせる結果となった。
この成功に注目したグーグルが、ヒントンやクリジェフスキー、スツケヴァーら研究室のメンバーを丸ごと引き抜いて、自社のAI研究開発に当たらせた。これに伴い彼ら研究者は各々、少なくとも数百万ドル(数億円)の報酬を得たと見られている。
こうしたグーグルの動きを見たフェイスブック(現在のメタ)も、それに勝るとも劣らない高額の報酬で、ヒントンに匹敵する高名なAI研究者ヤン・ルカンを自社に新設したAI研究所の所長として招聘した。
間もなくアンドリーセン・ホロウィッツなど目敏いシリコンバレーのVC(ベンチャー・キャピタル)が、次々と起業したてのAI開発スタートアップに投資を始めた。
こうして、それまで大学など研究者コミュニティに留まっていたAIに産業界が注目し、その研究開発に巨額の資金が流れ込むようになった。これが現在のディープラーニング、ひいてはAIブームの始まりである。
AIの驚異的進化を印象付けた囲碁・将棋での勝利
Gettyimages
当時グーグルは、ヒントンをはじめとするトロント大学出身の研究者達を「グーグル・ブレイン」と呼ばれるAI研究部門に配属した。
その一方で、これとは別に2014年、英国のAIスタートアップ企業「ディープマインド」を推定6億ドル(600億円以上)で買収し、(かなりの独立性を維持した形で)グーグルの傘下企業として同じく先端AIの研究開発に当たらせた。
つまりグーグルには当時、少なくとも2つのAI研究部門が存在したことになる。
ディープマインド共同創業者の一人で、同社CTO(最高技術責任者、当時)のデミス・ハサビスは少年時代には「チェスの神童」として知られ、14歳以下のプレイヤーの中で世界第2位にランクされたこともある。
彼は自らの生誕地ロンドンの中高一貫校を飛び級して16歳で卒業すると、地元のゲームメーカーで開発者として働き始めた。その後、自分でゲーム開発会社を起業・経営した後、ケンブリッジ大学とロンドン大学で学び、そこで神経科学(脳科学)の研究に没頭した。その後、2010年にAI研究者のムスタファ・スレイマン、シェーン・レッグらと共同でディープマインドを創立した。
ハサビスは既に15、6歳の頃には「自分は将来AIの研究者になる」ということを決意していた。チェスの神童時代も含めゲームメーカーの開発者、脳科学者など多彩なキャリアは全て最終的にはAI研究に活かすためであったという。
なぜ、極めて若くしてAI研究者を目指したのか? その動機についてハサビスは次のように語っている。
「私は中高一貫校時代に物理学が大好きで、(量子電磁力学の研究でノーベル賞を受賞した)リチャード・ファインマンや(電弱統一理論で同じくノーベル賞を受賞した)スティーブン・ワインバーグらは私のヒーローだった。
ところが、よくよく彼らの業績を調べてみると、長い物理学の歴史全体から見れば大した進歩を成し遂げていないことに気付いた。つまり人間の能力だけでは、ファインマンなど驚くべき天才のような人たちでも、やれることには限界があると知ったのだ。
そこで私は物理学者ではなくAI研究者になろうと決心した。自分で開発した高度なAIを科学者をサポートするツールとして使って貰えれば、物理学ひいては自然科学全体に無限の進歩をもたらすことが出来る、と思ったからだ」
こうした発言を聞くと、ハサビスは頭でっかちの理想主義者という印象を受けるが、実際にはそうでもなさそうだ。
彼はシリコンバレーで培ったコネを頼りにピーター・ティールのバーティに招待されると、この著名投資家を言葉巧みに説得してディープマインドの創業資金を出して貰うなど、意外に現実的で世故に長けた一面も備えている。
こうしたハサビスの現実的な姿勢は、彼の研究テーマの選択にも活かされている。
2010年にディープマインドを共同創立した直後から、2014年に同社をグーグルに買収されるまでの数年間、ハサビスらは1970年代に流行した卓球ゲーム「ポン(Pong)」など古典的ビデオゲームを自動でプレイするAIの研究開発に没頭した。
なぜ、このような研究テーマを敢えて選択したのか? その理由について、ハサビスは次のように語っている。
「当時、先端AIの研究者らが好んで選択するテーマには(工場や倉庫で人間と共同作業するヒューマノイドなど)高度なAIを搭載した自律型ロボットなどがあった。しかし、こうしたロボットの部品はどれも高額で、その仕組みは複雑で、その動作は鈍い。また、ロボットはしばしば故障したり壊れたりしてしまう。
つまりロボットのように現実世界、あるいは物理的な世界を相手にした技術は研究テーマとして(成果を出すのが)非常に難しいと感じた。それよりむしろ(現実世界の物理的な障害とは無縁の)シミュレーションを選択すべきだと思った。
ビデオゲームはシミュレーションの一種であると同時に、私が16歳の頃から研究開発に取り組んできた技術であるだけに十分な知識や経験も蓄えている。最初は『ポン』のように初歩的なゲームから始めて、最終的には『スタークラフト』のような高度で複雑なゲームまでAIで自動的にプレーできるようになった。
今から振り返れば、このビデオゲームという研究テーマこそが、先端AIのアルゴリズムを研究・開発する上で最も効率的な道であったと思っている」
やがてグーグルに買収されたディープマインドはそれらゲームAIの研究で培った「ディープラーニング」や「強化学習」などの先端技術を囲碁に応用して、2014年に「AlphaGo」と呼ばれる囲碁AIソフトを開発した。
AlphaGoは2016年、それまで囲碁の世界タイトルを通算16回も獲得したトップ棋士である韓国のイ・セドルを4勝1敗で下し、翌2017年には当時「人類最強の棋士」と謳われた中国の柯潔を3戦全勝で退けた。
日本でも山本一成をメインに開発された将棋AIソフト「ポナンザ」が2017年、当時の佐藤天彦名人に勝利するなど、囲碁や将棋のような伝統的ボードゲームは先端AIの驚異的な実力を一般の人たちに知らしめる格好の機会となった。
これにより、2012年頃に始まった世界的なAIブームが決定的なものとして人々の脳裏に焼き付けられることになったのだ。
ChatGPTブームを経て記号接地問題に挑戦
その後、ハサビスらが率いるディープマインドはAlphaGoの開発で培った高度なAI技術を分子生物学の分野に応用し、2018年にタンパク質の構造を予測する「AlphaFold」と呼ばれる学術的ツールを開発した。これは文字通りタンパク質を構成するアミノ酸配列の折り畳み構造を、ディープラーニングを使って予測するシステムだ。
こうした先端AIの自然科学への応用は、本来ハサビスが目指していたことでもあるし、AlphaFoldが新たなタンパク質の存在を計算科学的に予言するシステムとして、分子生物学者らによって重宝されていることも事実だ。
しかし科学者以外の一般の人たちから見て、AlphaFoldのような学術的AIは確かに重要であることは分かっても、日常生活に照らして今一つピンと来なかった。
AlphaGoがイ・セドルら囲碁の世界的強豪を打破した当時、しばしばテレビや新聞などの国際報道を賑わせた天才ハサビスだが、それ以降は主要メディアに登場する機会がめっきり減った。これに象徴されるように、世界的なAIブームは一種の「中だるみ期」に入った。
しかし、この期間にあってもディープラーニングのような先端AIを支える計算インフラの整備は着々と進められた。創業当初、ゲーム用グラフィックス・ボードのメーカーだったNvidiaはいつの間にか巨大なAI半導体メーカーへと成長し、「A100」に代表される超高速の新型GPUを次々と開発・商品化した。
この頃、世界的には未だ無名のAIスタートアップOpenAIがこれら超高速GPUを多数採用して、「GPT」あるいは「大規模言語モデル(LLM)」と呼ばれる新種のAI開発を水面下で進めていった。
参照)サム・アルトマンの「OpenAI」はどのように生まれ、進化し、この先どこへ向かうのか? 【第1回】
このLLMをベースとする対話型AI「ChatGPT」が2022年11月末にリリースされると、その流暢な言語能力や驚くべき博識などから、瞬く間に世界的なブームを巻き起こした。
LLMの商品化でOpenAIに先を越されたグーグルは一時、社内的混乱の様相を呈したが、すぐに態勢を立て直して追撃を図った。
同社は2023年に入ると「グーグル・ブレイン」と「ディープマインド」という2つのAI研究部門を統合して、「グーグル・ディープマインド」と呼ばれる研究所へと一本化した。そのリーダーにはハサビスが任命された。つまり彼はグーグルが行うAIの研究開発を全て指揮する立場になったのだ。
同年12月、グーグル(・ディープマインド)は言語、映像、音声など様々な種類のデータを処理できるマルチモーダル型のLLM「Gemini」を発表した。多彩な認識機能を獲得したことで、このAIには一種の推論能力も育まれたという。
ユーチューブにアップされたプロモーション・ビデオでは、Geminiが空力抵抗の小さい流線形の自動車の方が角ばったデザインの自動車よりも高速で移動すると予測するなど推論能力の片鱗を覗かせた。が、このビデオはグーグルが入念に細工を施した一種の「やらせ動画」ではないかとの批判も浴び、ハサビスにとってはほろ苦いデビューとなった。
彼が率いるグーグル・ディープマインドは今後、Geminiをロボットに搭載するなどして、このAIが物理的な現実世界と相互作用できるようにすることを目指している。
これによって、いわゆる「記号接地問題(Symbol grounding problem)」と呼ばれる古典的な難問を解決したいという。つまりLLMという「身体(からだ)を持たないAI」がロボットの身体を借りて現実世界を実体験することによって、「言葉」という記号の意味を体感できるようにする、ということだ。
2010年に英国でディープマインドを共同設立した当初、現実世界における様々な物理的障害を慎重に考慮して、むしろビデオゲームのようなシミュレーションAIの研究から始めたハサビスだが、今回満を持してその枠を破り、現実世界を相手にしたロボットAIの開発に乗り出すことになる。
その行く先には、今や最大のライバルとなったOpenAIが目指しているのと同じ「AGI(人工汎用知能)」の姿が見え隠れしている。
小林 雅一(作家・ジャーナリスト)
|