고려대학교 데이터과학원 석좌교수 허명회
인공지능이 날로 강력해지고 있다. 과장 좀 하자. 어제 인공 지능에 놀랐는데 오늘 또 놀란다. 장차 어떤 놈이 나타날까. 10년 후에, 100년 후에는? 인공지능의 앞날을 놓고 우리 인간은 지금 두 부류로 나뉘어 있다. 누구는 기대가 크다. 누구는 걱정이 크다. 개인 성향이고 취향인데 뭐라 하겠는가. 다만 화두 하나를 던지며 나름 제언을 하고 싶은 것이 있다. 인공지능 시대를 과연 어떤 학습 자세로 어떻게 맞는 게 좋을까.
며칠 전 수학 교양서를 읽어가다가 어떤 한 문답에 꽂혔다. 문제는 이랬다. “지구의 둘레는 40만 킬로미터(=L)이다. 내 키는 1.6 미터(=h)이다. 발 아래로 지구를 한 바퀴 감은 길이 L의 밧줄이 있다. 이것을 지구 한 바퀴 모두에서 내 머리 높이로 올리려면 얼마만큼 더 긴 밧줄이 필요한가?” 엄청 길겠거니 짐작하고, 연필을 꺼내 계산해 보니 웬걸 불과 10미터(=2*pi*h)였다. 답을 꺼내 보니 정말 그랬다. 인공지능이 제대로 해내는지 생성형 인공지능 ChatGPT에 물었다. 같은 답을 냈다.
하지만 인공지능이 어떤 문제에 정확히 옳은 답은 낼 수 있어도 인간처럼 그런 새로운 문제를 만들어낼 수 있을까. 바빌로니아–그리스 시대에 인간이 찾아낸 원에 관한 두 공식, 즉 반경이 r인 원의 둘레가 2*pi*r이고 원의 면적이 pi*r*r이라는 공식을 인공지능이 만들어낼 수 있었을까. 당대에 오늘날 같은 컴퓨터가 있었다고 해도 말이다. 글쎄, 아니지 않을까.
인공지능이 나오기 이전, 인간은 사실상 지구 유일의 학습자였다. 인간은 두뇌로, 마음으로 학습한다. 그런 인간 앞에 어느 날 갑자기 기계 학습의 산물인 인공지능이 출현했다. 지구에 두 학습자가 존재하게 된 것이다. 당연히 모두가 궁금했다. 누가 더 나은 학습자인가. 2016년 세기적 아니 지구적 대결의 무대가 세워졌다. 이세돌과 알파고가 대국했다. 일반의 예상과 기대를 깨고 알파고가 압승을 거두었다. 이어서 새로운 유형의 기계 학습자 ChatGPT가 주목받으며 등장했다. 지능 대결에서 인간과 기계의 승부는 이제 기계 승으로 굳어지는 판국이다. 다른 많은 이들처럼 나 또한 속이 편치 않다. 그래서 최근에 인간이 기계를 이긴 사례가 정말 없었는지 찾아보았다.
“Human vs. supervised machine learning” (Cognitive Systems Research, 2022년)이라는 논문이 눈에 띄었다. Kuhl 외 4인의 연구자가 인간 학습과 기계 학습을 비교하였다. 그들은 3*3 그리드에 놓인 흑백 돌의 패턴을 찾아내는 학습 실험을 하였다. 피실험자 인간은 독일 대학생 44명이었고 피실험자 기계는 로지스틱 회귀, 나무모형, 신경망을 활용했다. 학습 대상인 3*3 패턴이 모두 512개(=2의 9 거듭 곱)였으므로 학습 경험이 쌓일수록 기계가 월등하리라는 것은 실험 이전에 명백한 것이었다. 연구자들이 흥미를 갖는 문제는 학습 초기에 인간이 나은가, 기계가 나은가 하는 것이었다.
연구에 따르면 학습의 초기엔 인간이 기계보다 우월했다. 직관적 추론 및 비유적 이해력에서 인간이 기계보다 뛰어나기 때문일 것이다. 그러나 인간의 우월함은 오래 지속되지 못했다. 경험이 누적됨에 따라, 그러니까 데이터가 커질수록 인간은 기계에 뒤졌다. 기억에서 기계에 뒤지고 두뇌가 피로해지기 때문이겠다. 반면, 기계는 경험이 누적될수록 강해진다. 기계는 기억력이 좋고 판단이 정확하다. 집중력에 한계가 있는 인간과 대조적이다.
나는 교육 및 연구 경력의 상당 부분을 통계학에 기반을 둔 기계 학습 분야에 할애해 왔다. 그러면서 나름 확신을 얻게 된 기계 학습의 원리가 몇 있다. 그 가운데 인간 학습에도 적용될 것으로 생각되는 두 가지를 공유한다.
하나는 과도 학습(over-training)의 폐해이다. 과도 학습은 학습 모형을 데이터의 세세한 부분까지 맞추어 나가는 것인데, 일견 정교해 보이지만 이렇게 구축된 모형은 재현성이 떨어진다. 일반화에 취약하기 때문이다. 일정 정도를 넘어서는 학습은 애써서 헛고생하는 도로(徒勞)일 뿐이다. 이런 이유로 기계 학습에서는 검토 표본을 별도로 설정해 학습 모형을 조율하고 테스트를 통해 학습 모형의 성과를 공정히 측정한다. 이는 인간 학습에도 잘 적용되는, 특히 우리나라 중등 교육 현장에 큰 시사점을 던져 주는 원리가 아닌가 한다.
두루 알다시피 우리나라 중고등학생들은 난도가 높지 않은 문제들을 실수 없이 풀어내는 데 온 힘을 쓴다. 그런 훈련을 대치동식 사교육이 주도하고 있다. 과도 학습의 전형인데도, 고교 내신과 수학능력시험 등 주요 대입 평가가 학습 데이터와 중복되어 있는 탓에 훌륭한 방법으로 알고 모두가 따라 한다. 그러나 과도 학습은, 인간에 적용되는 경우, 실제보다 실력을 부풀려 보이게 하고 마음의 힘을 빼버린다.
40년 대학에서 학생들을 가르치고 지도하면서 참으로 안타까움을 금치 못했다. 대학에 와서 본격화되어야 할 ‘주니어’들의 지적 성장이 정체되거나 둔화되고 만다. 그 원흉은 다름 아닌 중고등 시절의 과도 학습이다. 얼마 전 정부 교육 당국은 수학능력시험의 범위를 축소해 가겠다고 발표했다. 수험생의 부담을 덜어 주겠다는 것이다. 그러나 취지와는 달리 현실적으로는 수험생의 고통을 가중시킬 것 같다. 학습 범위가 좁아지면 문제를 배배 꼰 킬러 문항이 나오게 되고, 킬러 문항을 넘는 데는 사교육이 효과적이기 때문이다. 우물을 깊게 파기 위해서는 우직하게 땅을 넓게 파는 것이 맞다.
다른 하나는 모형 앙상블(model ensemble)의 효과이다. 복잡한 상황에서는 우수한 모형 하나보다 덜 우수한 여러 모형의 총합이 더 우수하다는 것이다. 달리 말하자면, 뛰어난 지식의 소유자 한 사람보다 덜 뛰어난 지식을 가진 사람 여럿이 더 우수하다. 나무 모형들의 묶음인 랜덤 포레스트(random forest)가 대표적 예이다. 물론 전제 조건이 있다. 모형의 다양성과 독립성이다. 모형 앙상블의 요체는 독립적인 다양한 개체들이 각자가 확보한 지식을 공유하고 융합하는 데 있다.
이 원리 또한 우리 사회에 던지는 시사하는 바가 크다. 한국 사회는 너무 경쟁적이고 권위적이며 게다가 집단의 구성이 너무 동질적이고 집단 내 편 가름이 일상화되어 있어 앙상블이 잘되지 않는다. 앙상블이 작동하도록 사회적 토양을 바꿔나가야 한다.
한국 교육은 경쟁력을 지나치게 강조한다. 고교 내신이 대표적이다. 심하게 말하면 옆 학우를 밀치고 올라서야 좋은 대학에 간다. 물론 인간 사회에 경쟁이 없을 수는 없다. 인구가 넘쳤던 개발도상국의 ‘시니어’ 세대에서는 경쟁력이 미덕이기도 했으나 이제는 더 이상 아니다. 경쟁력과 협업 능력은 균형이 잡혀야 하는데 우리 사회는 경쟁력을 지나치게 우선시한다. 대치동식 사교육은 자라는 학생들의 다양성을 심각하게 저해한다. 일타 강사의 매끄러운 강의에 ‘주니어’들이 집단으로 생명력을 잃고 있다.
확신컨대, 인공지능과 함께 영위할 미래 사회는 구성원간 경쟁보다는 협업을 통한 생산성이 더 중요한 사회이다. 20대 초반의 젊은이들을 대학 현장에서 수십 년 지켜본 나는 학생들의 획일적 학습 방식에 놀란다. 안타깝게도 많은 학생이 기본 개념에 대한 숙고 없이 반복적 문제 풀이에 치중한다. 그것은 인간보다는 기계에 더 맞는 학습 방식인데 말이다. 현재의 입시제도 하에서는 그런 방식이 효율적일 수 있으나 대학에 들어오고부터는 이런 방식은 뚜렷한 한계를 갖는다.
인공지능 시대는 인간 학습자와 기계 학습자, 두 학습자의 시대이다. 인간이 유일하며 지고한 학습자인 시대는 갔다. 더 이상 인간은 모든 분야에서의 지식 패권자가 아니다. 인공지능 시대의 인재이고자 한다면 남보다 큰 지식 경쟁력을 갖는 것이 목표가 되어서는 곤란하다. 대신, 남과의 협업적 자질을 키워야 한다. 나의 독자성을 키우고 남과 다른 다양성을 함양해야 한다. 주어진 문제를 실수 없이 풀어내는 수동적인 기계 학습자가 아니라 새로운 태스크를 디자인하여 비전을 보여주는 능동적인 인간 학습자가 되어야 한다.
필자소개
미국 스탠포드 대학교 (Ph.D. in Statistics)
- (전) 고려대학교 통계학과 교수
- (전) 성신여자대학교 석좌교수