통계‧빅데이터‧인공지능 분과 이영조
동서양에는 공교롭게 비슷한 이야기가 전해지고 있다. 옛날 옛적에 한 총각이 있었다. 그는 같은 동네 마음씨 곱고 아리따운 어느 처녀를 연모하였다. 그런데 그 처녀가 어느 날 갑자기 죽고 말았다. 이 총각은 너무 보고 싶었기에 눈에 보이는 나무토막마다 이 처녀를 조각하기 시작하였다. 그러다 마침내 어느 날 그녀를 꼭 닮은 조각상 하나를 만들게 되었고, 매일 그 조각상을 보듬고 울며 지내었다. 이를 불쌍히 여긴 산신령은 청년이 잠들었을 때, 그 조각상을 생명이 있는 사람처럼 만들었다. 잠에서 깬 청년이 옆에 있는 처녀를 눈으로 보고, 손으로 만지고, 몸의 향내를 맡고, 꿈인지 생시인지, 너무 황홀하고 기뻤다. 이 청년은 그 후 그녀와 다시 함께 평생을 행복하게 살았다는 이야기이다. 여기서 만약 이 청년이 산신령의 작품인 그 처녀를 실제 사람으로 간주했다면 ‘튜링 테스트’를 통과 했다고 볼 수도 있을 것이다.
본래 처녀의 몸과 동작이 유사하게 만든 기술들, 즉 이 유사하게 만들어진 ‘몸-기계’가 얼마나 유사한 사람의 성질의 것이냐 하는 것은 로봇 공학의 문제일지 모른다. 그러나 이제 실제 사람과 유사하게 이야기하고 생각하는 것처럼 보이는 ‘몸-기계’의 정신적 지능의 문제를 생각해 보자. 나는 인간이 기계에 제공한 지능을 인공지능으로, 또 이제부터 유사하게 만들어진 ‘몸-기계’를 로봇이라 부르겠다. 우리는 이 로봇이 지능을 가졌는지를 어떻게 판단할 수 있을까? 튜링은 로봇과 인간을 서로 다른 방에 있게 하고 모니터로 서로 수신 이야기하게 할 때 사람이 상대 로봇을 사람으로 착각하면 로봇이 지능을 가졌다고 간주하는 ‘튜링 테스트’를 제안하였다.
인공지능의 연구는 20세기 수학에서 통계학과 컴퓨터학이 분리되어 발전하면서, 그동안 축적된 학문적 발견들이 서로 융합되면서, 21세기 이르러 인공지능이라는 새로운 열매를 얻게 되었다. 이것은 인간 뇌의 여러 부분 중에서, 이성적 판단을 주관하는 전두엽의 역할을 수행한다. 예로부터 이성적 논리적 사고는 일반원리에서 세부 현상들을 설명하는 연역법과 세세한 각 사례의 종합, 즉 데이터로부터 일반원리를 산출해 내는 귀납법이 있다. 그리고 서구에서는 수학 또는 논리학으로 설명되는 연역적 접근은 이른바 대륙 철학의 프랑스의 데카르트, 독일의 칸트 등을 통해서 발달했고, 통계학으로 대변되는 귀납적 접근은 베이컨, 로크 등 영국 철학에서 발달했다.
Alan M. Turing
프레게의 새로운 논리학, 칸토어의 집합론 등의 대두를 통한 수학의 발전은 20세기에 들어서 할베르트로 하여금 세계 수학학회에서 수학적 증명을 기계적으로 다 생성해 냄으로 수학의 완성 가능성을 여러 난제 중 하나의 중요한 수학의 과제로 발표하게 하였다. 그러나 젊은 수학자인 괴델이 불완전성 정리를 발표, 모든 참인 수학적 문제를 증명할 수 없음을 밝혀내서, 수학적 연역적 논리의 한계를 입증 수학이 완성될 수 없음을 밝혔다. 이 괴델의 증명은 많은 수학자들을 매료시켜 세계 유수 대학들에서 널리 가르쳐졌다. 이때 캠브리지 대학의 학부생 튜링은 기계적으로 수학을 푼다는 것이 아마도 이러한 기계적 작동을 말하는 것이 아니겠냐는 한 페이지짜리 설계도면과 함께 논문을 발표하였는데 이것이 바로 오늘날 모든 현대 컴퓨터의 모형이다. 수학적으로 증명할 수 없다는 것은 컴퓨터가 이를 사전에 인지하지 못하여, 주어진 과제를 끝내지 못하고 계속 돌아가는 멈춤의 문제가 되었다.
튜링은 2차대전 발발 후 ‘에니그마’를 개발하여, 일군 암호 해독에 성과를 내서 연합국의 승리에 크게 이바지하고, 영국 50파운드 지폐에 그의 얼굴을 남겼다. 튜링과 함께 일했던 통계학자 굿 교수에 의하면, 튜링은 통계학
2024년판 새로운 우도 이론 책
의 베이즈 정리를 잘 알지도 못하면서, 스스로 이를 개발, 암호 해독을 하였다고 한다. 즉 수학의 연역적 문제 증명을 위해 개발된 컴퓨터는, 태생적으로, 독일 암호 전문(데이터)들로부터, 독일 암호 원리를 규명하는 귀납적인 통계학과 결합하여, 에니그마를 통한 암호 해독 등 현실의
R. A. Fisher
각종 문제 풀이에 사용되어 왔다. 또한 인류는 20세기 피셔를 통해 발전한 통계학의 귀납 이론들을 함께 더욱 발전시키면서, 거대 통계모형이 컴퓨터의 새로운 알고리즘과 융합, 데이터 분석 소프트웨어가 등장하며 빅데이터 시대를 열게 된다.
Frank Rosenblatt
Geoffrey Hinton
윌터 피츠는 신경과학 분야에서 활동한 논리학자로서 인공 신경망의 작동 원리를 최초로 수학적으로 모델링 하였다. 이후 신경생물학자인 로젠블랫에 의해 퍼셉트론을 개발 인공신경망 이론에 '학습(learning)'이라는 개념을 추가하였다. 이는 레이어가 하나인 신경망으로, 분류문제를 제대로 해결하지 못하고 생을 마감한다. 레이어가 두걔 이상이면 분류문제가 해결되어, 뉴럴 네트워크라는 이름으로 관심을 받았으나 통계모형보다 우수하지 않아 크게 성공하지 못했다. 이후 뇌에 대해 관심이 많았던 힌튼의 역전파 알고리즘과 병열 연산을통해 세 개 이상의 레이어를 수용할수 있는 딥 런링이 개발되어 새로운 시대를 열게 된다. 인공지능이란 용어는 매카시에 의해 처음 제안되어 그를 이분야 창시자로 부른다. 인공지능은 인간 뇌 연구에서 시작되어, 뇌의 작동원리가 아직 잘 규명되지 않아, 딥런닝이 왜 잘 작동하는지는 아직 수수께끼이다.
인공신경망은 21세기에 이르러 연역법(수학)과 귀납법(통계학)을 모두 아우르는 지능을 가진 로봇(컴퓨터학)도 만들게 되는 단초가 되었다. 튜링이 사용한 베이즈방법은 18세기 통계학이다. ‘챗-지피티’에서 가장 그럴듯한 가능도가 높은 단어를 선택하거나, 알파고가 승률이 가장 높은 수를 두는 것들은 20세기 초, 피셔의 우도(likelihood) 이론에 근거한다. 통계학에서는 우도 이론이 21세기에 더 한층 발전하고 있고 여러 새로운 저서들이 나오고 있다. 뇌신경과학과 컴퓨터학의 융합을 통해 인공지능을 가진 로봇을 만들게 되었다. 이제 첨단 수학과 통계학을 통해 그 작동원리가 규명되어야 하며, 이는 현재 인류의 사고를 뛰어넘어 더욱 발전할 수도 있어 미래 인류의 큰 보배가 되었으면 한다.
필자소개
서울대학교 통계학과 명예교수
단국대학교 데이터 지식 서비스 공학과 석좌교수
한국 과학기술 한림원 출판 부원장