|
|
||||||
기계에 구별 능력을 주는 ‘검색’
문자로 저장된 정보의 상징은 아마도 이집트 알렉산드리아에 있었다는 도서관일 것이다. 거기에는 고대의 지혜를 적은 수십만 권의 파피루스 두루마리가 수장돼 있었다고 한다. (다행히(?) 화재로 그 많은 문헌들이 소실되었기 망정이지, 그게 그대로 전승되었다면 후학들은 정말 골치 아플 뻔했다.) 알렉산드리아에 있었다는 이 도서관은 얼마 전까지만 해도 모든 도서관의 원형이자 전범이었다. 하지만 디지털 테크놀로지의 등장과 더불어 도서관의 개념 자체가 달라지기 시작한다.
과거에 도서관은 정보들을 모아놓은 하나의 장소를 의미했다. 하지만 디지털 기술은 정보의 집적에서 이 장소의 구속을 파괴해버렸다. 오늘날 정보는 수많은 장소에 산포된다. 여기서 정보는 ‘분류’되는 대신에 위계질서 없이 ‘링크’된다. 인터넷은 디지털 시대에 환생한 알렉산드리아의 도서관이다. 도서관에서 가장 큰 문제는 정보의 검색이다. 전통적 도서관에서는 기다란 서랍에 빽빽이 꽂힌 카드와 책 뒤에 붙은 색인이 인터페이스의 역할을 했다. 인터넷이라는 디지털의 도서관에서는 검색엔진이 그 역할을 담당한다.
도서관의 정보는 유한하지만, 인터넷의 정보는 거의 무한하다. 따라서 검색 작업 역시 기계에 맡길 수밖에 없다. 검색엔진의 요체는 생각이 없는 기계에 정보의 중요도를 판단하게 하는, 중요한 정보와 사소한 정보를 구별하는 능력을 부여하는 데 있다. 그런 의미에서 그것은 일종의 ‘인공지능’ 프로젝트라 할 수 있다. 물론 기계는 생각이 없다. 따라서 기계가 정보의 중요도를 인식하게 하려면 정보의 중요성이라는 질적 특성을 양화(量化)시켜야 한다. 논문의 질이 보통 인용 횟수로 측정되듯이, 정보의 질은 거기에 링크된 수로 측정된다.
하지만 링크가 많다고 해서 반드시 중요한 정보란 보장은 없다. 이 때문에 검색엔진은 좀더 똑똑해야 한다. 구글이 다른 것들을 제치고 검색엔진의 총아로 떠오른 것은 그 문제를 해결하는 독특한 해법, 이른바 ‘페이지 랭크’(page rank) 덕분이다. 가령 10명이 열어본 페이지 10개와 링크된 페이지가 있고, 1천 명이 열어본 페이지 1개와 링크된 페이지가 있다고 하자. 링크의 수는 전자가 10배나 많지만, 중요도는 외려 후자의 10분의 1밖에 안 될 수도 있다. 따라서 똑똑한 검색엔진은 해당 페이지만이 아니라 그것과 링크된 페이지의 중요도 역시 고려해야 한다.
물론 링크된 페이지들의 중요성은 다시 거기에 링크된 또 다른 정보들의 페이지뷰에 따라 측정된다. 그리고 이것들의 중요성은 또 그것들과 링크된 또 다른 페이지의 뷰로 측정된다. 이렇게 고리의 수를 하나씩 늘려갈수록, 기계가 한 검색 결과는 인간이 직접 한 검색 결과와 점점 더 유사해질 것이다. 구글의 창시자 래리 페이지와 세르게이 브린은 의식하지 못했을지 모르나, 이것은 러시아의 수학자 마르코프가 창시한 속박확률의 개념, 이른바 ‘마르코프 체인’의 원리를 이용한 검색이라고 할 수 있다.
모던 예술가 “새로움은 요소가 아니라 배치”
문제는 기계검색이 열어주는 새로운 인식론적 의미를 인식하는 것이다. 흔히 우리는 정보는 해독이 중요하고, 검색은 부차적이라고 생각한다. 하지만 그것은 정보가 희귀하던 시절의 낡은 습관인지도 모른다. 오늘날 정보는 더 이상 희귀하지 않다. 외려 현대 대중은 정보의 홍수 속에서 익사할 위험에 처해 있다. 이런 시대에 필요한 능력은 정보 하나하나를 해독하는 능력보다는, 그렇게 범람하는 정보 속에서 자기가 필요로 하는 정보에 성공적으로 접근(access)하는 능력이다. 그런 의미에서 검색엔진은 정보의 바다에 떠 있는 구명보트라 할 수 있다.
기계검색은 정보를 생산하는 방식 역시 변화시킨다. 모던 예술가들은 일찍이 “새로움은 요소가 아니라 배치에 있다”고 말한 바 있다. 인터넷에 들어가 보라. 당신이 쓰고 싶은 글은 이미 누군가 써놓았다. 당신이 그리고 싶은 그림은 이미 누군가 그려놓았다. 당신이 찍고 싶은 사진은 이미 누군가 찍어놓았다. 정보가 홍수처럼 쏟아지는 시대에 거기에 물 한 바가지 더 들이붓는 것은 그다지 의미가 없는 일이다. 중요한 것은 새로운 정보를 생산하는 것이 아니라, 이미 존재하는 정보들을 새로운 방식으로 조직하는 것이다.
포스트모던의 예술가들은 이미 존재하는 텍스트를 패러디하고, 이미 존재하는 이미지를 몽타주하고, 이미 존재하는 사운드를 리믹스한다. 그들은 이미 존재하는 다른 작품들을 이리저리 혼성으로 모방해(이른바 ‘패스티시’) 또 다른 작품으로 조직해낸다. 한마디로 그들은 디지털 시대에 널리 퍼질 정보 생산의 방식을 아날로그 방식으로 미리 보여주었던 것이다. 한마디로 구글은 그저 이미 존재하는 정보를 찾는 수단에 불과한 게 아니다. 그것은 동시에 새로운 정보를 창작하는 위력한 무기가 될 수 있다.
‘창작’이라는 개념은 아직도 고상한 아우라를 듬뿍 뒤집어쓰고 있다. “아, 떠오른다, 떠오른다, 오선지….” 창작의 순간을 이렇게 묘사하는 것은 낡은 낭만주의 수사법이다. 학생들에게 나는 늘 “영감을 일으키는 기계적 절차가 있다”고 가르친다. 그게 뭐냐고? “구글에 들어가 검색창에 낱말을 타이핑하고 엔터키를 치라.” 그러면 단지 그 낱말이 포함돼 있다는 단순한 이유에서 이제까지 생각지도 못했던 수많은 텍스트들이 화면에 나타날 것이다. 바로 그것이 디지털 시대의 기계적 영감이다.
물론 기계는 인간보다 멍청하다. 하지만 바로 그것이 창작을 할 때는 장점이 된다. 기계가 전혀 엉뚱한 자료를 내밀 때, 인간은 본의 아니게 자신이 상상할 수 있는 한계 밖에 존재하는 정보를 접하게 되기 때문이다. ‘영감’이란 인간이 합리적으로 생각할 수 있는 것의 밖에서 불현듯 사건처럼 찾아오는 어떤 것이다. 존 케이지와 같은 작가들이 우연에서 창작의 영감을 얻어냈듯이, 랜덤하게 돌아가는 검색엔진의 멍청함이 외려 인간의 상상력을 확장해줄 수 있다.
검색엔진의 멍청함이 상상력을 확장해
이렇게 얻어진 기계적 영감은 당연히 기계적 글쓰기의 바탕이 된다. 일단 구글 검색창에 검색어를 친다. 검색된 문건들을 순서대로 읽어나가면서 쓸 만한 자료는 마우스키로 복사해 ‘hwp’에 옮겨놓는다. 이 작업이 끝나면, hwp상에서 문건들을 읽어나가면서 불필요한 정보는 삭제하고, 필요한 부분만 남겨놓는다. 이어서 그렇게 남겨진 조각 정보들을 앞뒤로 자리를 바꾸거나 이리저리 결합시키면서 몽타주를 한다. 이제 남은 것은 글을 매끄럽게 다듬는 것뿐이다.
내가 쓴 <놀이와 예술 그리고 상상력>은 적어도 60% 이상은 그런 방식으로 쓴 것이다. 이번에 낸 <교수대 위의 까치>는 99% 구글 검색을 통해 얻은 자료로 쓴 것이다. 아쉽게도 ‘네이버’ 검색으로는 이 작업이 아직 불가능하다. 거기에는 여러 가지 이유가 있을 것이다. 하지만 가장 큰 원인은 서구 네티즌들의 인터넷 사용이 정보적(informative)이라면, 한국 네티즌들의 그것은 친교적(fatique)·오락적(ludic)이라는 데 있을 것이다. (대신 생활밀착적 정보는 역시 네이버가 짱이다. 한국은 여전히 구술문화다.)
당신이 검색이다
세상의 모든 정보를 인터넷에 올리는 야심찬 계획, 지금 구글이 준비하고 있는 것들
■ 정재승 카이스트 교수·바이오및뇌공학과
글로벌 브랜드컨설팅 그룹인 인터브랜드(Interbrand)가 매년 실시하는 브랜드 가치 평가보고서에 따르면, 2009년 브랜드 가치가 가장 많이 상승한 기업은 단연 ‘구글’이다. 구글은 올해만 브랜드 가치가 25%나 상승해 약 40조원에 달했으며, 지난해 10위에서 올해 7위로 뛰어올랐다. 지난 몇 년간 100위 안에 들었던 미국 기업들이 경기 침체로 줄줄이 브랜드 가치가 하락했고, 자동차 기업과 생활용품 관련 기업들이 크게 부진한 것과 비교하면, 구글의 약진은 더욱 돋보인다.
|
||||||
세상 정보만 아니라 몸속 정보도
1998년, 스탠퍼드대 대학원생이던 래리 페이지와 세르게이 브린이 ‘구글’이란 기업을 작은 창고에서 만들었을 때만 해도, 이 작은 정보기술(IT) 회사가 세상을 바꾸어놓을 것이라고는 아무도 생각하지 못했다. 페이지뷰와 링크에 따라 검색 결과를 알려주고, 위성사진을 통해 지구상의 모든 지도를 올려놓는가 하면, 동영상 창고인 유튜브까지 사들였다. 최근에는 실사 기반의 지도 서비스인 ‘구글 스트리트뷰’(위치를 지정하면 그 동네의 실제 거리 사진을 제공해주는 서비스)가 선을 보이는가 하면, 음악을 검색하는 서비스도 곧 선보일 예정이다.
구글이 이처럼 지난 3~4년 사이 크게 약진한 데는 새로운 광고 비즈니스 모델을 수립하고, 안드로이드폰 등을 통한 각종 모바일 애플리케이션 지원 등으로 사업을 다변화한 점이 크게 인정받았기 때문이다. 구글 검색을 통한 페이지뷰 횟수에 따라 기업으로부터 광고료를 받음으로써 검색 웹페이지 자체를 상업 광고로 물들이지 않았다는 데 네티즌들은 열광했고, 이른바 ‘구글 철학’이라 표현되는 그들만의 생각이 브랜드 가치로 고스란히 녹아들어간 결과이리라.
그렇다면 구글의 약진은 앞으로도 계속될까? 아니면 IT 산업이 포화상태에 도달하면 구글의 운명도 하강 국면을 맞이하게 될까? 이 질문에 답하려면 그동안 구글이 했던 일보다 ‘지금 구글이 준비하는 것들’을 살펴볼 필요가 있는데, 늘 새로운 생각들을 시도하는 그들의 행보 중에서 주목할 만한 것이 두 가지 있다.
주목 포인트 하나. 지난 몇 년간 구글은 미 캘리포니아 마운틴뷰에 위치한 작은 회사 ‘23앤드미’(23andme)에 40억원 이상의 돈을 투자해왔다. 이 회사의 사장은 구글의 공동 창업자인 세르게이 브린의 아내 앤 워지스키. 그러나 그들이 패밀리 비즈니스 관점에서 이 회사에 투자한 것은 아니다.
<오프라 윈프리 쇼>에도 소개된 바 있는 ‘23andme’ 서비스는 간단하다. 서비스를 신청하면 일주일 안에 키트(kit)와 간단한 설명서를 집으로 보내준다. 이 키트 안에 침을 뱉어서 다시 우편으로 보내면, ‘내가 유전적으로 유방암과 당뇨병 등을 포함해 118가지 유전질환에 걸릴 가능성’을 확률로 표시해 알려준다.
그뿐인가? 유전자 검사를 통해 내 조상은 어디에 살았으며, 내 몸속에 다양한 민족의 피가 얼마나 섞였는지, 내 혈육의 뿌리를 찾아준다. 이미 시판되고 있는 ‘23andme’ 서비스의 가격은 399달러(약 45만원). 필요한 분석 기간은 8주. 구글은 지금 침 한 번만 퉤! 뱉으면 내가 누구인지, 내 몸이 앞으로 어떻게 될 것인지를 알려주는 무시무시한 세상을 준비하고 있는 것이다. (유전자가 포함된 인간 염색체의 개수가 23이라 ‘23andme’라는 이름이 붙었다.)
2008년 <타임>이 ‘올해의 발명품’으로 선정하기도 한 ‘23andme’ 서비스에 주목해야 하는 이유는 이제 구글이 세상에 떠도는 정보를 모으는 데 그치지 않고 우리 몸속에 있는 바이오 정보에 관심을 갖기 시작했다는 사실에서다.
독감 검색이 늘면 독감 발생이 많다
그들의 야심찬 꿈은 사람들이 병원에 갈 때마다 받게 되는 진료카드 정보, 약을 처방받은 정보, 수술 정보 등이 모두 전산화돼 있으므로, 그것을 한데 모으겠다는 것이다. 그래서 나만이 볼 수 있는 내 사이트에 들어가면 내 유전 정보를 포함해 모든 의료 정보가 담겨 있어 내 건강을 자동적으로 체크해주고 때론 주치의에게 주요 상황을 알려주는 서비스를 제공하겠다는 것이 그들의 목표다.
그들은 이런 정보가 개인뿐만 아니라 사회적으로도 가치가 있다고 믿는다. 사회의학적 연구나 인류학적 연구, 진화생물학적 연구뿐만 아니라, 질병 동향을 미리 파악하고 심지어 예방도 할 수도 있다는 얘기다.
실제로 구글은 몇 년 전부터 독감 관련 검색어에 대한 연구를 했다. 그 결과, 매년 독감 시즌마다 특정 검색어(독감 이름, 독감 예방법 등) 패턴이 눈에 띄게 증가하는 것을 발견했다. 그리고 이러한 패턴을 미국 질병통제예방센터(CDC) 데이터와 비교해봤더니, 검색 빈도와 독감 증세를 보인 환자 수 사이에 밀접한 상관관계가 있다는 사실을 발견했다. 다시 말해 독감과 관련된 단어 검색량을 보면, 실제 독감 환자 수, 독감 유행 지역 등을 예측할 수 있다는 뜻이다.
이는 ‘검색 빈도수는 개인의 생활을 반영한다’는 평범한 사실을 보여주고 있지만, 여기에 개인의 유전 정보와 진료 정보 등이 합쳐지면 ‘세계 시민의 보건복지에 크게 기여할 수 있다’는 것이 구글의 주장이다. 실제로 구글은 독감 관련 검색 분석 자료를 매일 공개하고 이를 신속하게 업데이트함으로써 독감 발생에 대한 조기경보 시스템 구실을 하기도 했다.
두 번째 주목 포인트. ‘인터넷에서 정보를 찾다’와 이미 동의어가 돼버린 구글은 지난 5년간 ‘세상의 모든 정보를 인터넷에 올리겠다’는 야심찬 프로젝트를 줄기차게 진행해왔다. 현존하는 모든 책들을 스캔해 서비스하는 ‘디지털 도서관’을 구축하기로 하고, 지금까지 1천만 권에 이르는 책의 디지털 작업을 완료한 바도 있다. 저작권이나 출판권 등 법적으로 해결해야 할 문제가 산적해 있지만, 페이지뷰에 따른 비용 지불 등의 방식으로 이 문제가 원만하게 해결될 가능성이 높다. 세상의 모든 정보가 디지털화되는 세상이 도래하는 것이다. 텍스트 정보뿐만 아니라, 오디오와 비디오, 동영상까지도 모두 디지털화되면서 구분이 사라지는 세상이 10년 내에 올 것이다.
그렇게 되면 종이책은 큰 위기를 맞을 것이다. 그동안 사용 방식(user interface)이 편하지 않아 종이책을 선호했던 사용자들도 아마존의 ‘킨들’이나 소니의 ‘북리더’ 같은 e북으로 움직이게 될 것이다. 이제 e북은 종이책을 보는 것과 큰 차이가 없는데다, 길거리에서 쉽게 다운로드를 받게 될 예정이어서 오히려 더 편해질 것이다. 게다가 e북이 대중화되는 데 ‘만화’가 크게 기여할 것으로 보는데, e북의 만화 서비스 수준은 종이책의 추종을 불허한다! 지하철이나 버스에서 신문을 구입할 필요도 없다. 내 e북으로 신문이 배달되며, 배달된 TV 뉴스를 동영상으로 볼 수도 있다. 앞으로 10년 내에 도시인들의 ‘생활양식’이 크게 달라질 거란 게 개인적인 생각이다.
‘사용자 발신 콘텐츠’ 근본적인 변화 틀을 짜다
유튜브와 페이스북, 트위터의 성공은 웹서퍼들이 정보의 바다를 탐색하는 데 그치지 않고 스스로 정보를 만들어내는 ‘사용자 발신 콘텐츠’ 쪽으로 근본적인 변화가 이뤄지고 있음을 시사한다. 그렇다면 이러한 모든 정보를 어떻게 조직화하느냐가 관건인데, 구글은 한마디로 이 모든 정보를 편하고 효율적으로 서비스할 ‘시스템’을 만들고 있다고 보면 된다.
‘그들이 꿈꾸는 세상이 과연 인류에게 유용할 것인가’에 대해서는 근심과 걱정 또한 많지만, ‘그들이 과연 꿈꾸는 세상을 이루어낼 것인가’에 대해서는 의심과 회의가 적다. 프로그램 개발자와 통계학 전공자들로 가득 찬, 그래서 대부분의 업무가 전혀 창의적이지 않은 전세계 ‘검색 포털 사이트 회사’들과 달리, 구글은 ‘세상에서 가장 창의적인 사람들을 불러모아 생각할 시간을 충분히 주고 있기’ 때문이다.