출처 : 전자신문(2000.11.30)
지난 51년 설립된 MIT링컨연구소(MIT Lincoln Laboratory)는 보스턴 근교
렉싱턴에 소재하고 있다. 레이더 기술의 연구개발을 선도해 오다 확대 개편돼
첨단 과학기술을 대공 감시시스템, 미사일, 전장감시 및 판별, 항공교통 통제,
통신 등 안보 국방과 관련한 제반 분야에 적용하는 연구를 추진해 오고 있다.
그만큼 많은 프로젝트가 군사 기밀로 분류되면서 대외적으로 자세히 알려져 있지
않다. 하지만 2300명의 전문인력으로 구성되어 MIT 전체 예산의 절반 이상을
사용하면서 300개가 넘는 MIT 소속 연구소 중 최대 규모를 자랑한다.
이같은 군용 안보관련 기술을 전문적으로 연구하는 링컨연구소가 특히 주목하는
연구분야 가운데 하나가 음성번역기술, 그중에서도 한국어와 영어간
음성번역분야다. 미국 정부는 전세계에 군대를 파견하고 있는 만큼 이 분야에
높은 관심을 갖고 있다. 특히 주한미군의 존재로 인해 한국어와 영어간
음성번역기술 연구는 우선적으로 지원하고 있다.
링컨연구소는 원천적으로 언론의 접근이 불허되어 있는 군사지역 내에 있다.
하지만 정보기술연구그룹 리더인 클리퍼드 와인슈타인(Clifford Weinstein)
박사의 배려로 MIT전산학과 연구실에 시스템을 이동 설치해 상세한 설명과 함께
번역시스템의 시연을 볼 수 있었다.
링컨연구소의 번역시스템인 CCLINC(Common Coalition Language System
at Lincoln Laboratory)<그림 참조>는 한국어와 영어간 의미프레임을 매개로
음성이나 텍스트를 번역한다. 즉, 주어진 입력을 분석해 그 의미를
의미프레임으로 나타내고, 이로부터 상대 언어를 생성한다. 의미분석이나
문장생성은 미리 작성한 해당 문법을 이용하고 있다.
특기할 점은 이전에 수작업으로 수행했던 문법작성 작업을 최근에 상당부분
자동화했다는 것. 즉, 미리 품사 정보가 부여된 대규모 텍스트인
「코퍼스」로부터 문장종류, 주체, 동작 등으로 구성되는 의미프레임에 대응하는
전형적인 품사 순서의 패턴을 추출해 이를 의미분석문법과 생성문법에 반영한다.
이러한 문법작성의 자동화는 시스템의 개발기간을 대폭적으로 단축시킨다. 한영
번역시스템 개발 프로젝트의 과제책임자인 이영숙 박사는 『군용 문서
번역시스템을 기반으로 작업영역을 바꾸어 의사와 환자간 나누는 대화를 번역하는
시스템을 개발한 결과, 일단 품사 정보가 부여된 코퍼스를 확보한 뒤 불과 일주일
만에 시제품을 만들 수 있었다』고 설명했다.
CCLINC시스템이 기존 연구성과와 다른 특징은 모든 입력 음성대화에 대해
번역을 시도한다는 점이다. 의미분석 모듈에서 우선 문장 전체에 대해 분석을
시도하고 실패할 경우에는 이를 부분으로 나누어 재시도하고, 이 때에도 분석이
이루어지지 않는 구문은 단어 대 단어로 변환해 출력한다. 특히 이 시스템은
중간언어 접근방식을 취함으로써 의미프레임을 지원하는 어느 언어와도 번역을
가능케 했으며 다국어로 확장하기 쉬운 구조를 가지고 있다. 게다가 의미프레임을
매개로 다른 시스템과의 연동도 가능하다.
이 번역 시스템은 현재 한미연합사령부에서 시험 사용중이다. 지난해 4월부터
한미연합사령부는 이 시스템을 도입, 한미 합동 훈련 수행시 공동회의 시간을
크게 줄일 수 있었다. 링컨연구소는 이 번역엔진을 정보검색 시스템과 결합해
한영 정보검색시스템까지 구현했다.
이러한 음성인식기술의 요람인 링컨연구센터의 음성번역과 사용자 인터페이스
기술 중심의 연구성과는 보스턴시에 소재한 스피치웍스(SpeechWorks) 본사의
연구진 설명에서도 뚜렷이 나타난다.
지난 수십년간의 음성 처리기술 개발 결과를 바탕으로 최근 들어 미국을 중심으로
관련 시장이 열리고 있다. 음성 기술 전문회사로는 뉴앙스(Nuance)사와 함께
스피치웍스사가 가장 큰 주목을 받고 있다. 스피치웍스사는 1994년 MIT에서
스핀오프(spin-off)된 회사로 현재 보스턴, 몬트리올, 싱가포르 등에 소재한 여러
분사에 300여명의 직원이 근무하고 있다. 창사 이래 인력과 매출이 급성장해 지난
8월 나스닥에 등록, 성공적인 기업공개가 이루어졌다. 스피치웍스사는 특히
전화음성에 대한 음성인식 기술 전문회사다. 역점을 두고 있는 분야는 기존
터치톤 기반 자동응답서비스에 음성인식 기술을 부가하여 사용 편이성과 작업
효율성을 높이는 데 있다.
스피치웍스사는 현재 자사의 제품을 유나이티드항공사, 증권회사인
E트레이드(E*Trade), 전화회사인 AT&T와 MCI, 그리고
페더럴익스프레스(FedEx) 등 여러 분야의 회사에 납품하고 있다. 또 최근 한국의
메텔사와 공동으로 현대증권에도 증권안내 서비스 시스템의 구축을 추진하고
있기도 하다. 관련시장은 크게 고객응답관리 소프트웨어 시장이 2004년
100억달러 이상, 음성포털시장이 2003년 50억달러 이상으로 전망하고 있다.
마케팅담당 리히만 이사는 『동종업체들과 공동으로 실시한 설문조사 결과,
음성인식기능을 부가해 얻은 전화비용 절감효과가 많게는 50%에 달하고 있으며,
응답자의 90% 이상이 앞으로 음성인식 부가 서비스를 채택할 계획이 있다』고
말한다. 특히 그는 시장잠재력을 가진 분야로 의료, 법률, 회계, 각종 예약 업무
등을 드는데 주저하지 않는다.
향후 시장개척과 관련, 이 회사는 표준화가 진행되고 있는 VXML(Voice
eXtensible Markup Language)에 큰 비중을 두어 연구를 진행하고 있다. 기존
인터넷 웹사이트를 방문하는 것과 같이 전화로 원하는 사이트를 자유로이 연결해
여러 가지 정보를 얻을 수 있는 음성 인터넷의 가능성을 높게 보고 있는 것이다.
이 시장 또한 기존 인터넷시장과 함께 폭발적으로 시장 성장세를 보일 것으로
전망되는 가운데 여기에 사용되는 음성인식 및 합성기술 시장의 미래에 주목하고
있다. |