2024년 2월 18일 일요일
『비전공자도 이해할 수 있는 AI 지식』
박상길 지음/ 2022.4.5./ 반니/ 439쪽
인공지능 엔지니어인 저자는, 인공지능에 대한 잘못된 인식을 바로잡고, 현재 우리 실생활로 들어오고 있는 인공지능 기술을 제대로 알리기 위해 이 책을 썼다고 한다. 알파고, 자율주행, 검색엔진, 기계번역, 챗봇, 내비게이션, 추천 알고리즘 등에서 인공지능이 사용되어 온 역사를 아주 흥미롭게 다루고 있으며, 인공지능에서 사용되는 핵심 알고리즘들을 독자가 아주 이해하기 쉽게 설명해 나간 책이었다.
《본문 중에서》
1980년대에 들어 머신러닝(machine learning)이라 부르는, 우리말로는 ‘기계학습’이라고 부르는 알고리즘을 활용하기 시작하면서 인공지능 분야는 다시 성과를 내기 시작합니다.
머신러닝이란 말 그대로 기계가 스스로 학습하는 방식입니다. 이제 더 이상 사람이 규칙을 입력하지 않습니다. 그 대신 컴퓨터가 데이터에서 스스로 규칙을 찾아냅니다. 더구나 사람이 찾아내지 못하는 규칙도 컴퓨터가 학습을 거쳐 찾아낼 수 있게 됩니다. p.31~32
2001년 마이크로소프트의 연구자들은 충분한 데이터만 있으면 어떠한 알고리즘을 거치든 관계없이 정확도가 높아진다는 관점의 논문을 발표합니다. … 즉 복잡한 문제일수록 좋은 알고리즘을 찾아서 문제를 해결하기보다는, 복잡성을 인정하고 거대한 데이터의 힘을 활용해 문제를 해결하는 게 훨씬 더 합리적이라는 얘기죠. p.45~46
2015년 가을에는 구글이 텐서플로(TensorFlow)라는 프로그램을 공개했습니다. … 뒤이어 페이스북에서 파이토치(PyTorch)라는 딥러닝 프로그램을 오픈소스로 공개했으며, 매우 직관적인 방식으로 복잡한 모델도 이해하기가 쉬워서 연구자들이 논문을 쓸 때 가장 많이 활용하는 프로그램이 되었죠. 지금은 두 프로그램을 이용한 수많은 딥러닝 응용 서비스가 나와 있습니다. … 스마트 스피커, 기계번역, 챗봇 같은 서비스 또한 모두 텐서플로 또는 파이토치로 구현합니다. 이 모든 것이 오픈소스의 힘이죠. … 오픈소스는 기술의 대중화와 저변 확대에 큰 영향을 끼쳤고, 인공지능 연구의 진입장벽을 크게 낮춰 누구나 쉽게 참여할 수 있도록 하여 엄청난 발전을 거듭하게 했습니다. p.55~56
알파고 제로는 최강의 바둑 인공지능입니다. 무엇보다 알파고 제로는 더 이상 인간 바둑기사에게서 배우지 않고 스스로 학습해 실력을 키웠죠. 알파고 제로 이후에 딥마인드는 2018년, 알파제로(AlphaZero)를 공개합니다. … 알파제로는 이제 바둑뿐만 아니라 체스, 일본 장기 등까지 게임 영역을 넓혔습니다. … 알파제로는 바둑뿐만 아니라 체스, 장기까지 거의 모든 종류의 보드게임에서 인간의 도움 없이도 스스로 학습하여, 모든 수를 탐색하지 않고도 최고의 실력을 낼 수 있음을 증명했습니다. p.92~93
스탠퍼드 레이싱팀의 책임자 스런은 대회가 끝난 후 인터뷰에서 자기 경험을 이야기했죠. “차량이 스마트하게 움직이도록 하기 위해서는 두세 가지 규칙이 아니라 수만 가지 규칙이 필요하다는 점을 깨달았습니다. … 결국 우리가 선택한 방식은 머신러닝과 빅데이터였습니다. 다시 말해 수많은 규칙을 일일이 프로그래밍하는 것이 아니라 인간에게 운전을 가르치는 것과 똑같은 방식으로 기계를 가르치기로 했습니다. 저는 운전을 했고, 자율주행차는 저를 지켜보며 관련 행동을 모방했습니다.” p.103~104
자율주행이 보편화된다면 우리 모두 아예 기본적인 운전 방법을 잊어버리게 되지 않을까요? 수십 년간 자율주행에만 의지해 온 사람이 긴급 상황이 발생했다고 갑자기 직접 운전을 할 수 있을까요? 앞으로 자율주행에 익숙해질 사회가 반드시 고려해야 할 부분입니다. p.136
MIT는 자율주행차가 사고를 낼 수밖에 없는 상황을 도덕 기계(moral machine)로 명명하고, 온라인으로 공개 설문조사를 진행했습니다. … 2018년 10월 MIT는 도덕 기계의 연구 결과를 〈네이처〉에 발표합니다. … 결국 사람들은 도덕적으로는 다수를 살려야 한다고 하지만 정작 본인은 그런 차를 구매하지 않습니다. 이러한 딜레마 때문에 기술적으로 완벽한 자율주행차가 나온다고 할지라도 자율주행차의 보급은 늦어질 수밖에 없습니다. 과연 다수를 위해 운전자를 희생시키는 차가 있다면, 이 차를 사랑하는 내 가족에게 선뜻 사줄 수 있을까요? p.136~139
구글이 제안하고 엔비디아에서 구현한 음성 합성 모델 타코트론 2는 사람과 거의 구분할 수 없을 정도로 자연스러운 음성을 합성해 냅니다. … 이처럼 음성 합성 모델은 점점 단순한 형태로 변하면서 성능은 오히려 더 좋아지고 있습니다. 풍부한 표현력을 지닌 딥러닝의 힘이라고 할 수 있죠. … 타코트론 2는 … 사람인지 아닌지 거의 구분이 안 되는 수준이죠. … 알파고가 인간을 능가한 것처럼 조만간 딥러닝이 사람보다 더 자연스러운 소리를 내게 될지도 모를 일입니다. p.240~242
오랜 침체기에 빠져 있던 기계번역은, 인공 신경망을 만나면서 마침내 돌파구를 열었습니다. 딥러닝의 가장 성공적인 사례를 하나만 꼽으라면 단연 기계번역이라고 해도 과언이 아니죠. 고품질의 기계번역은 점점 언어의 장벽을 무너트리고 있습니다. 기술의 발전이 드디어 신의 형벌마저 깨트릴 준비를 하고 있는 셈이죠. 바벨탑으로 혼돈에 빠졌던 인류는 이제 ‘언어 통일의 시대’에 한 발짝 성큼 다가섰습니다. 과연 인간은 신의 형벌을 극복할 수 있을까요? p.281
2013년 구글은 단어의 의미를 벡터로 표현하는 매우 획기적인 방법을 발표합니다. 그 방법의 이름은 워드투벡(Word2Vec)으로, 단어(Word)를 벡터(Vector)로 바꾼다는 매우 직관적인 이름이죠. 무엇보다 놀랍도록 정교하게 단어의 의미를 표현해 내 많은 이가 깜짝 놀랐습니다. 이처럼 단어를 벡터라는 숫자로 표현하는 것은 단어 각각의 특징을 추출해 수치화하는 것과 비슷합니다. p.302
세계 최초의 컴퓨터 프로그래머 에이다 러브레이스(1815~52, 조지 고든 바이런의 딸)는 컴퓨터는 스스로 무언가를 만들 수 없으며, 인간이 지시한 일만 할 수 있다는 점을 강조했습니다. … 튜링이 러브레이스의 주장을 논리적으로 반박했다면, 알파고는 러브레이스의 주장이 틀렸음을 결과로 입증합니다. 알파고 개발팀 중 누구도 이세돌을 이길 수 있는 바둑 실력을 갖추지 못했고, 심지어 이들은 알파고의 전략 또한 제대로 이해하지 못했습니다. 그 누구도 알파고에게 세계 챔피언을 이길 수 있는 전략을 가르쳐주지 못했죠. 하지만 알파고는 자신을 만든 개발자들이 할 수도 없고 이해할 수도 없는 일을 해냈습니다. … 러브레이스는 인간이 수백 년 후 기계가 스스로 데이터를 학습해 직접 규칙을 만들어 낼 줄은 결코 예상하지 못했을 겁니다. p.314~316
GPT-3는 더욱 놀라웠습니다. 인간을 위협할 정도라고 했던 GPT-2보다 100배나 더 큰 모델이었거든요. GPT-3가 학습한 원본 데이터는 무려 45TB에 달합니다. … GPT-3는 사람과의 대화는 물론, … 어떤 웹 사이트를 설명하면 그 사이트를 직접 만들고, 구현 원리를 설명하면 코딩을 하기도, 파워포인트 발표 자료를 만들기도 합니다. … 이러한 방대한 데이터를 학습하며 GPT-3는 문장을 넘어 데이터의 생성 원리를 이해하게 된 것입니다. … GPT-3는 마치 인간의 언어를 완전히 이해하거나 과거를 추억하는 듯한 패턴도 보여주었습니다. p.321~323
사실상 시중에 있는 모든 내비게이션은 A* 알고리즘을 이용해 최적 경로를 계산한다고 할 수 있죠. 이처럼 최적 경로를 안내해 주면 이제 내비게이션이 할 일은 모두 끝난 걸까요? 그렇지 않습니다. 아무리 빠른 길이라도 많은 차량이 몰리면 그 길은 다시 정체 구간이 됩니다. … 이를 브라에스 역설(Braess’s Paradox)이라고 합니다. … 따라서 차량이 적절히 분산하도록 내비게이션은 모든 차량에 동일한 최적 경로를 제공하기보다 우회 경로를 포함한 다양한 경로를 제시할 필요가 있습니다. 물론 내비게이션이 전체 교통 상황을 고려해 특정 사용자에게 최적이 아닌 경로를 강제해도 되는지에 관해서는 여전히 논란의 여기가 있습니다. p.374~375
통계에 따르면, 유튜브에서 사람들이 보는 영상 중 70%는 알고리즘이 추천한 영상이라고 합니다. … 지금은 넷플릭스 시청의 80%가 추천을 거쳐 이뤄집니다. 넷플릭스도 유튜브처럼 서비스 전체가 추천으로 구성되어 있다 해도 과언이 아닙니다. … 음악 서비스도 마찬가지입니다. … 페이스북의 뉴스피드는 정교한 추천 알고리즘에 따라 어떤 게시물을 먼저 보여줄지 결정합니다. p.379~382
《목차》
1 인공지능/ 위대한 인공지능, 깨어나다
2 알파고/ 인간을 능가하는 기계의 등장
3 자율주행/ 테슬라가 꿈꾸는 기계
4 검색엔진/ 구글이 세상을 검색하는 법
5 스마트 스피커/ 시리는 쓸모 있는 비서가 될 수 있을까
6 기계번역/ 외국어를 몰라도 파파고만 있다면
7 챗봇/ 카카오 챗봇에게 고민 털어놓기
8 내비게이션/ 티맵은 어떻게 가장 빠른 길을 알까
9 추천 알고리즘/ 알 수 없는 유튜브 알고리즘이 여기로 이끌다