MS, “사용자 목소리로 번역되는” 음성 번역기 시연
음성 인식을 이용해서 실시간으로 언어를 번역하는 기술은 지난 몇 년간 큰 관심을 받아왔다. 하지만 마이크로소프트가 지난 주 열린 테크페스트 2012(TechFest 2012)에서 시연한 기술은 이런 아이디어를 한 단계 끌어 올렸다는 평가를 받았다.
마이크로소프트 리서치(Microsoft Research)에서 개발한 이 번역기는 다른 번역기와 마찬가지로, 사용자가 모국어로 이야기 하면 스페인어나 프랑스어, 중국어 등 다른 언어를 스피커로 들려준다.
하지만 다른 번역기와는 다르게, 스피커에서 나오는 목소리가 컴퓨터 로봇의 소리가 아니라, 사용자의 음성이 그대로 재생되며, 사용자의 얼굴을 3D 이미지로 보여준다.
모노링구얼 TTS(Monolingual TTS)이라고 불리는 이 시스템은 현재 26개의 언어를 지원한다.
이 시스템을 익숙하게 사용하기 위해서는 기존의 음성인식 프로그램보다 더 많은 시간이 필요하다. 사용자의 음성을 모노링구얼 TTS에 적용시키기 위해 한 시간 가량의 트레이닝이 요구된다.
만일 이 애플리케이션이 스마트폰에 적용된다면, 여러 나라를 여행하는 사람들에게 유용하게 사용될 수 있으며, 언어 학습에도 잘 활용할 수 있다.
마이크로소프트의 번역과 관련된 영역은 경쟁 업체보다 넓다. 사용자의 모습을 단순히 모방하는 것이 아니라, 사용자가 말할 때 목소리나 입술의 움직임까지도 똑같이 재현해 내는 것을 목표로 한다.
온라인 텍스트 기반의 번역기로 유명한 구글 역시 음성 기반의 번역기를 제공하고 있다. 사용자가 모국어로 이야기를 하면, 원하는 언어로 번역해 주는데 스피커에서 나오는 소리는 로봇의 소리이다.
안드로이드용 무료 앱 트랜스레이트(Translate)를 제공하고 있는데, 완벽하다고 하기에는 어렵다.
애플은 시리(Siri) 앱을 통해서 자연어 인식 기능을 제공하고 있지만, 번역 기능은 지원되지 않는다. 그러나 아이폰 4S를 탈옥하면 링구어(Lingual)라는 앱을 사용할 수 있는데, 이 앱은 시리에 말을 하면 아이폰 화면에 30개 언어로 말이 표시된다. editor@itworld.co.kr