동문을 찾아서
AI 한국시장은 좁다, 사우디부터 뚫고 세계로 가겠다
서울대총동창신문 제552호(2024.03.15)
하정우(컴퓨터공학97-04)
네이버클라우드 AI 이노베이션 센터장
세계 3번째 초거대 언어AI ‘하이퍼클로바’ 개발
자타공인 최고 전문가, 공학한림원 젊은공학인상도
“게임이 좋아 컴퓨터 전공…논문 읽기가 취미”
“서울대 교수 국내 박사 채용 인색은 아쉬움”
AI 전문가들이 인정하는 ‘찐’ 전문가 하정우 동문. 그는 세계 3번째 초거대 언어 AI인 네이버 하이퍼클로바 개발의 총책임자다. 2014년 ‘비디오의 스토리 이해와 생성을 위한 멀티모달 인공지능’을 주제로 쓴 박사학위 논문은 그해 모교 컴퓨터공학부 최우수 박사학위 논문상을 받았다. 이후 AI 연구자로서 NeurIPS, ICLR, CVPR, ACL 등 세계적 인공지능 학회에 40편 이상의 논문을 발표했고, 구글 스칼라 기준 약 1만 피인용 수를 기록하고 있다. 그의 혜안을 듣고자 자문위원 등으로 위촉한 공공기관만 10여 개가 넘는다. 최근 공학 한림원이 주는 젊은 공학인상도 받았다. “쉴 때 논문 읽기가 취미 아닌 취미가 됐다”는 그를 3월 11일 경기도 분당 네이버 본사에서 만났다.
-최근 사우디아라비아의 IT 전시회 ‘LEAP 2024’에 다녀오셨죠?
“지난주 금요일 밤에 귀국했어요. 다음날 아침 기업 강연이 있어서 다녀왔는데, 피곤해서 뇌랑 입이 따로 노는 느낌이더라고요.”
-사우디 정부와 진행하는 일이 있나요.
“사우디 정부가 인공지능 등 IT 관련해서 중국, 미국 등 여러 해외 기업들과 협업하는데, 그 나라 기업에 종속되는 문제에 대해 고민하고 있습니다. 그래서 제3의 선택지를 찾는 것 같고, 그런 측면에서 네이버에 기회가 오지 않을까, 계속 문을 두드려 보는 중이죠. 선배님들이 1970년대 중동 붐 시절부터 쌓아온 좋은 이미지 덕분에 플러스가 되고 있어요. 또 K컬처 도움도 크고요.”
-인공지능 전문가의 길을 걷게 된 동기가 어떻게 되세요.
“컴퓨터공학과를 선택하게 된 건 단순히 게임이 좋아서였어요. 프로그래밍도 재미있어서 중학교 때부터는 컴퓨터공학과에 마음을 뒀죠. 그렇게 입학해 2학년 때 외환위기 사태를 맞습니다. 많은 학생이 자의 반 타의 반으로 군입대를 했고, 저도 마찬가지였죠. 전역 후에도 돈을 벌어야 하는 상황이라, 당시 처음 도입된 삼성그룹 인턴 1기 프로그램에 지원했죠. 졸업 후 삼성SDS에 입사했다가 2년 만에 나와, 2006년 모교 대학원에 입학했습니다. 장병탁 교수님 아래로 가면서 자연스럽게 머신러닝 인공지능에 입문하게 됐죠. 그때까지만 해도 인공지능에 대단한 비전을 갖고 있었던 건 아니고요. 교수님께 늘 감사한 마음이죠.”
-모교에서 후학을 가르쳐야겠다는 생각은 없으셨나요?
“이 문제 관련해 국내 대학에 불만이 좀 있어요. 학생들에게는 유학가는 게 의미없다 하면서 국내 박사들은 학교에서 뽑아주질 않아요. 특히 서울대가 심합니다. 교수보다는 필드로 나가야겠다, 마음먹고 찾아봤죠. 당시 딥러닝 중심의 인공지능을 회사 차원에서 제대로 할 수 있는 곳이 딱 두 군데가 있었어요. 삼성전자 종합기술원과 네이버였습니다. 삼성은 다녀본 경험이 있어서 네이버 랩스를 선택했죠.”
-네이버에서 어떤 일을 하시는지.
“네이버 클라우드 소속인데, 네이버 전체의 기술회사라고 이해하시면 좋을 것 같아요. 파파고, 웨일 브라우저 등 클라우드 기반의 소프트웨어 솔루션을 만드는 조직은 모두 이 안에 있죠. 제 역할은 AI 중장기 선행 연구, AI 안전성 그리고 글로벌 AI 전략 등을 수립하는 일입니다. 선행 연구 조직을 운영하다 보니, 어지간한 학교들보다 논문을 많이 써요.”
-AI이노베이션 센터에 몇 분 일하나요?
“정확한 수는 대외비고요, 몇 십 명 정도 됩니다. 석사도 있고 박사도 있는데, 중요한 것은 혼자 논문을 처음부터 끝까지 다 쓸 수 있는 사람들이라는 거죠. 아이디어 도출부터 실험, 글 작성까지 혼자서 다 할 수 있는 사람들로만 구성돼 있어요.”
-센터장님이 가장 강조하는 내용이 AI 주권이잖아요?
“데이터가 보이는 지식만 있는 게 아니지 않습니까? 글과 이미지에는 그 지역의 언어, 문화, 관습, 규범 같은 것들이 다 축적돼, 그 특성이 AI에 그대로 녹아듭니다. 그러면 실리콘밸리의 빅테크, 그러니까 오픈 AI, 구글, 메타가 만든 초거대 생성 AI는 물어보면 대답 잘하고 글도 잘 쓰는데 기저에는 북미 사상이 깔려 있거든요. 그러니 ‘동해’가 아닌 ‘일본해’라고 답하는 거고요. 이슬람 문화권을 생각해볼 게요. 전반적으로 실리콘밸리 빅테크에서 만든 생성 AI가 이슬람 문화권에 대해 네거티브하게 그렸어요. 그러면 이슬람 문화권 입장에선, 그런 AI를 써서 글을 만들면 위험해질 수 있잖아요. 많은 분이 실리콘밸리의 빅테크들이 워낙 앞서 나가서 전세계가 그 회사들의 서비스를 이용하게 될 거라고 하시는데, 저는 그렇게 안 된다고 보거든요. 세상 어떤 나라가 자기 국가, 지역, 문화, 종교 정체성을 다 없애고 그걸 쓰겠어요. 국가는 몰라도 전반적인 문화 지역권에서는 당연히 자체적인 AI를 만들기 위해 노력할 거라고 봐요.”
-인공지능 하면 오픈AI의 챗GPT를 떠올리는 사람이 많죠. 네이버 하이퍼클로바 X는 어떤가요?
“저희 장점은 한국 내부에 있는 디테일한 정보를 훨씬 더 정확하게 생성할 수 있다는 거죠. 평가해 보니까 전반적인 성능은 역시 GPT4가 강력합니다. 그런데 한국 특화된 문제들을 평가하면 GPT4보다 하이퍼클로바X가 더 잘해요. 국내에서 네이버 검색이 구글 검색을 이긴 것처럼 AI도 그렇게 되도록 노력하고 있습니다.”
-생성형 AI가 데이터를 학습해서 답을 하는 과정이 궁금합니다.
“엄청난 데이터가 인터넷에 퍼져 있지만, AI 학습에 쓰려면 적절한 선택과 가공이 필요합니다. 데이터를 모으는 비영리단체 서비스로 커먼 크롤(Com[1]mon Crawl)이라는 게 있어요. 공개된 저장소죠. 전세계 인터넷에 떠도는 엄청난 양의 문서가 모여 있습니다. 이 문서들을 바로 학습에 활용하기 힘들기 때문에 어떤 부분을 쓸지 결정하고, 적절히 가공하는 작업이 필요합니다. 이렇게 나온 자료가 구글의 C4나 레드파 자마 등이죠. 이 자료를 활용해 AI 학습을 시키죠. AI 학습에서는 모델과 데이터 양이 중요합니다. 요리로 비유하자면 모델은 냄비, 데이터는 재료라고 할 수 있죠. 적절한 냄비에 좋은 재료를 넣어서 알맞은 시간을 들여야 맛있는 요리가 나오듯, 모든 걸 고려해야 합니다. 모델이 커지면 똑똑해지는 것까지는 좋은데, 너무 비싸고 느려요. 전략적으로 결정을 내려야 하는 부분입니다. 네이버 하이퍼클로바X는 더 많은 한국 데이터를 전략적으로 선택하는 식이죠.”
-실시간으로 데이터를 가져올 순 없나요?
“AI 학습용으로 쓰는 두 가지 데이터가 있어요. 하나는 위 설명처럼 커먼 크롤에서 가져오는 방법이 있고 다른 하나는 각 사가 돈 주고 보유한 데이터가 있죠. 차별화되는 지점은 돈 주고 산 데 이터입니다. 최근 오픈AI가 과학 전용 AI를 만들겠다고 했는데, 그건 돈 주고 산 데이터라고 보시면 돼요.”
-올해 AI 전문가들의 화두는 뭔가요?
“실제적인 성과를 어떻게 만들어낼 것인가 죠. 2023년은 기술적으로 ‘이게 된단 말이야, 놀라운데’ 하는 기대감을 많이 줬죠. 이제는 ‘비즈니스에서 성과가 나와야 한다, 그럼 어떻게 성과를 만들 것인가’가 숙제죠. B2C든 엔터프라이즈든, 공공 영역이든. 킬러 애플리케이션을 포함해서 누가 가장 빠르게 성과를 낼 것인가가 관건이죠. 두 번째는 온디바이스나 로봇과 연계되는 부분일 것 같아요. 세 번째가 AI 안전성입니다. AI 위험성에 대해 걱정하는 이야기가 많이 나오고 있죠. 그런데 이런 상황에서 누가 리더십을 갖고 새로운 질서를 만들어갈 거냐, 그 틀 안에서 누가 대장이 될 거냐의 싸움으로 흘러가고 있습니다. AI를 중심으로 한 이러한 흐름 속에서 남들이 짜놓은 판에 들어가지 말고, 우리의 상황도 알려 운신의 폭을 넓히는 방향으로 가야죠. 그래야 우리에게도 힘이 있거든요.”
-인공지능의 미래에 대해서는 어떤 입장이세요.
“기본적으로 낙관주의자입니다. 사실 여러 가지 위험성이 있죠. 하지만 돌아갈 수 없는 상황이 됐어요. AI 기술을 연구개발하는 사람들은 위험성을 최소화하면서 혜택을 최대화하는 방향으로 가야죠. 위험하니까 하지 말자는 의미 없는 말이 됐어요. 인류에 가장 이득이 되는 방향으로 만들어야죠.”
-나쁜 마음을 먹은 엔지니어들이 없어야 되는데요.
“그렇죠. 규제가 필요하다면 이런 것들인 거예요. 또 중요한 게 AI 리터러시의 영역인데 AI가 점점 똑똑해질 거예요. 그러면 빌 게이츠가 얘기했듯이 이제는 누구나 AI 비서와 함께 살아가는 세상이 될 겁니다. 필요에 따라서는 나의 의사 결정을 위임하기도 합니다. 그럴 때 판단을 잘 내려야죠. 내가 비록 AI 에게 의사결정을 위임한다고 하더라도 책임은 내가 져야 돼요. 정확하게 이해를 하고 써야 됩니다. 만약에 통제권을 잃게 되는 순간이 소위 말하는 디스토피아가 되는 거죠. 가짜 뉴스 범람 등으로 언론 수용성 교육 이야기가 많이 나오고 있는데, 마찬가지로 AI 수용성 교육이 필요합니다.”
-많이 바쁘시죠? 외부 직함이 10개는 넘어 보이던데.
“네이버에도 여러 가지 포지션이 많은데 대표적인 직함이 AI이노베이션 센터장이고 그 다음 퓨처 AI 센터장이 있죠. 디지털 플랫폼 정부위원회에서도 AI 데이터 분과위원장과 초거대 공공 AI TF장을 맡고 있습니다. 그 외 중기부 장관 자문위, 금감원, 국방부, 과기정통부에도 AI 관련 자문을 하고 있습니다. 지자체 직함까지 하면 두 자릿수 이상 되는 것 같습니다.”
-서울대에서 굉장히 오래 있었잖아요. 1997년부터 2년 동안 삼성SDS에 몸담긴 했지만 석박사까지 마치며 2015년 졸업했죠? 애정도 많으실 것 같습니다.
“관악산 산신령 될 뻔했습니다. 모교는 사랑이죠(웃음).”
-좋아했던 공간이 있나요? “거의 302동에서 살았고요. 학부 때는 기숙사에 살았으니까 기숙사에 대한 추억이 좀 있죠. 술을 좋아해 낙성대 주포 마을(주막)을 자주 다녔죠.”
-학과 2년 선배 중 하정우가 있죠?
“베어 로보틱스 대표로 왕성하게 활동하고 계시죠. 흔치 않은 인연인데, 친하게 지내지는 않았어요(웃음). OT 때 선배님이 오셔서 전도를 하면서, 제 이름 듣고 같이 웃었던 기억이 납니다.”
-직원 뽑을 때 뭘 중시하나요.
“자기 스스로 만들고 개척해 나가는 면을 중요하게 봅니다. 협업 능력은 기본이고요.”
-자녀 이름이 하이든, 특이합니다.
“와이프가 클래식을 좋아합니다. ‘이든’이라는 이름이 순 우리말로 남들을 이롭게 한다는 뜻입니다. 하이든으로 지은 이유가 하이든이 천재면서 어렸을 때부터 행복하게 자라 장수를 한 작곡가입니다. 모차르트와 비교되죠. 그렇게 되기를 바라는 마음으로 지었죠.”
-집에서 많이 놀아주나요?
“제 딴엔 놀아준다고 하는데… 그래서 골프도 안 하거든요.”
-그럼 여가 시간에 뭐 하세요?
“아이랑 놀거나 보통은 논문을 보거나 일을 하죠. 아니면 드라이브하면서 풍경 보는 거 좋아합니다. 아들 태어나기 전에는 아내와 야구 관람 자주 다녔죠.”
-계획을 들려주세요.
“회사에 이걸 하겠습니다 라고 선언한 미션이 두 개 있습니다. 하나는 AI 안전성 관련해서 체계를 잘 잡는 것이고요. 다른 하나는 열심히 사우디를 다니는 이유인데, 올해 사우디에 초거대 AI 공동 프로젝트 만드는 게 제 미션입니다. 소프트웨어 솔루션 형태로 해외 수출이 지금까지 전무했습니다. 초거대 생성 AI로 그런 사례를 만들어보고 싶어요. 국내 시장이 작잖아요. 그것 때문에 ‘네이버 한계가 있을 거다’ 말도 많은 데 그럼 넓혀 나가야죠. 그걸 하게 된다면 네이버에만 기회가 되는 게 아니라 나라 전체의 기회가 된다고 봐요. 우리나라가 AI 글로벌 시장에서 진짜 3등 포지션 제대로 차지하게 하는 것. 그게 꿈입니다. 은퇴 후에는 디지털 격차를 해소하는 교육 분야에서 재능을 기부하고 싶습니다.” 김남주 기자