물리산책 -자동번역 자동으로 언어를 번역하는 기술
인기멤버
hanjy9713
2023.07.18. 20:03조회 3
댓글 0URL 복사
물리산책 -자동번역
자동으로 언어를 번역하는 기술
동명의 영화로도 만들어진 영국 SF작가 더글라스 아담스(Douglas Adams, 1952~2001)의 소설 [은하수를 여행하는 히치하이커를 위한 안내서]에는 바벨피시라는 외계생물이 나온다. 이 기괴한 물고기는 언어 중추에서 나오는 신호를 먹고 소화시켜 다른 사람이 이해할 수 있는 신호로 바꿔 배설한다. 소설 속에서 어쩌다 우주여행에 나서게 된 주인공은 바벨피시를 귀 속에 집어넣은 뒤 외계인과 자유롭게 대화할 수 있게 된다. 얼마나 편리한가. 외국어 공부에 시달리는 사람들이 보면 귀가 솔깃할 것이다. 그런데 현실에도 바벨피시가 있다. 바로 자동번역기술이다.
신속하고 정확하게 언어의 장벽을 넘어 통하는 자동번역기술.
컴퓨터를 이용해 한 언어를 다른 언어로, 자동번역기술
현실에서 볼 수 있는 바벨피시는 미국의 포털 사이트 야후가 제공 하는 자동번역 서비스의 이름이다. 기계번역이라고도 부르는 자동번역은 컴퓨터를 이용해 한 언어를 다른 언어로 번역해 준다. 구글도 수십 개나 되는 언어를 서로 번역해 주는 서비스를 제공하고 있고, 우리나라에서도 한일, 일한 번역기를 중심으로 자동번역 서비스가 널리 쓰이고 있다. 요즘 인터넷에서 어떤 화젯거리에 대한 해외 네티즌 반응을 신속하게 알 수 있는 것은 외국어를 잘 하는 능력자뿐만 아니라 이런 자동번역기술의 덕택이기도 하다.
컴퓨터로 언어를 번역한다는 생각은 이미 1940년대에 나왔다. 미국의 수학자인 워렌 위버(Warren Weaver, 1894~1978)가 1947년 자동번역이라는 가능성을 제시했고, 몇몇 과학자들이 합류해 1948년 천공카드를 이용한 자동번역 실험을 처음 시도했다. 초기 이론은 단순했다. 사전을 찾아 단어를 목적 언어의 단어로 바꾸고, 문법 특성을 고려해 어순을 조절해 주는 정도였다.
1954년에는 미국 조지타운대와 IBM이 공동으로 러시아어를 영어로 번역하는 기술을 개발했다. 당시에 쓰인 컴퓨터는 1952년에 출시된 ‘IBM701’, 프로그래밍은 CPU에 2진수 코드로 명령어를 입력하는 기계어로 했다. 문법 규칙이 6개, 어휘가 250개로 단출한 시스템이었다. 이 정도 문법 규칙과 어휘로는 일반적인 내용을 번역하기에 매우 부족했다. 연구팀은 유기화학에 관한 아주 짧은 문장 수십 개와 평범한 내용의 좀 더 긴 문장 몇 개를 러시아어에서 영어로 번역한 결과물을 일반에 공개했다. 이 실험 결과는 자동번역의 미래에 대한 낙관적인 견해를 널리 퍼뜨렸다. 그러나 실제 발전은 신통치 않았다. 지지부진하던 자동번역기술은 1980년대 들어서야 다시 활성화됐다. 그 동안 단순히 사전으로 단어를 대체하고 문법에 맞게 재구성하는 것만으로는 부족하며 언어를 이해해야 한다는 인식이 퍼졌다. 그래서 발달한 분야가 컴퓨터로 언어를 분석해 의미를 파악하는 ‘자연언어처리’ 기술이다.