야...어떻게 이런 사실들을 다 알고 계세요?참 대단하네요...
제가 생각해도 그래요.기계가 아무리 영리해도 이건 아니죠...
제가 학교다닐때 NEWSWEEK영어연구회(설 시립대)에서 항상 독해를
할때보면 문장상으로는 맞아도 문맥상을 볼때는 해석이 다른 경우가
많죠?ㅎㅎ 그래서 제 생각은요 번역기가 아무리 발달해도 완전 번역은
불가능 하다고 봅니다...그나 저나 번역하는 분들 대단한 분들이라는거는 아는 사람 아니면 잘 몰라요...자 우리 화이팅!!!
--------------------- [원본 메세지] ---------------------
제가 여러 인터넷 사이트의 유명하다고 알려진 영어번역기들을 시험테스트 해 본 결과 너무 번역이 형편없어서 그 불만으로 한 번 글을 쓰고자 합니다.
요즘 정말 영한 번역 프로그램들 가짜가 판치고 있습니다. 거의 성능 개선 없고, 이름만 바꿔 판매하는 경우가 많습니다. 영한 번역 프로그램을 바라보는 사용자들의 시선이 곱지 않습니다.
공급업체들은 너나 할 것 없이 자사 제품의 변역률이 90% 이상이라고 주장하지만 실제는 20~30% 수준에도 미치지 못하고 있습니다. 이것도 아주 간단한 단문에서나 가능한 일이고, 복문이나 관계대명사 등이 포함된 문장은 아예 번역조차 못하는 예가 허다한 경우를 봤습니다.
성능 문제에 대한 논의는 뒷전에 미루더라도 기능 면에서 전혀 개선이 이루어지지 않은 제품들이 이름과 포장지만 바뀌어 마치 새 제품인양 판매하는 사례도 많아 문제가 됩니다.
특히 번역 프로그램을 개발하는 몇몇 엔지니어들이 이 업체 저 업체로 자리를 옮기면서 수준 미달의 유사 제품을 마치 복사하듯이 여기저기에 만들어 내고 있어 문제라고 생각합니다.
번역 프로그램이라는 것이 일반 사람들에게 알려지기 시작한 것은 60년대부터입니다.
미국과 소련 두 진영으로 구분되던 냉전시대에 상대방의 문서들을 대량으로 번역하기 위해 정부 주도로 프로그램 개발이 추진되었습니다.
당시 미국의 유명한 언어학자 촘스키도 몇 가지 핵심적인 규칙만으로 모든 언어 구조를 설명해 낼 수 있다는 언어 이론을 발표해 기계번역 프로그램 개발에 활기를 불어넣었습니다.
80년대 처음 개발 시도 프로그램 개발에 가장 적극적인 나라는 미국이었습니다.
미국은 60년대 초 수천억원의 비용을 들여 국가 차원에서 기계 번역 프로그램 개발에 뛰어들었습니다.
그러나 번역은 단순히 문장 구조를 분석하는 것으로 해결될 수 있는 것이 아니라 인간의 지적 능력이 가미되어야 한다는 ALPEC의 최종 보고서가 나오면서 결국 개발 중단 사태를 빚게 되었습니다.
비슷한 시기에 제품 개발에 뛰어든 일본, 유럽 선진국들도 마찬가지였습니다.
이런 흐름 속에 국내에선 비교적 늦은 지난 87년 민간업체 주도로 개발이 처음 시도되었습니다.
한국IBM이 서울대 김영태 교수진과 손을 잡고 일본IBM이 개발해 놓은 기계번역 엔진을 토대로 영한 번역 프로그램 개발에 뛰어들었습니다.
이 때 개발된 첫 제품이 바로 앙꼬르입니다.
한국IBM의 앙꼬르 개발은 타 업체들에게도 영향을 주어 정소프트를 비롯해 몇몇 업체들이 번역 프로그램 개발에 뛰어드는 계기를 마련했습니다.
90년대 초 정소프트의 워드체인지를 비롯해 서울대 언어공학연구소의 트래니, 유진정보기술의 번역마당 등이 이 시기에 출시된 제품들입니다.
그러나 앙꼬르는 번역 속도가 너무 느리고, 번역할 문장도 10단어 이상을 넘어서면 프로그램 자체가 번역을 포기하는 등 갖가지 문제점을 노출해 사용자들로부터 외면을 받았습니다.
게다가 정소프트, 언어공학연구소, 유진정보기술 등의 제품도 이와 별반 다를게 없었습니다.
단문 위주의 문장은 비교적 엇비슷하게 번역해 냈지만, 한 문장의 단어 수가 많아지고 접속사와 관계대명사 등과 같은 복문들이 등장하면 프로그램 자체가 번역을 못하는 사례가 많았습니다.
이에 각 업체들은 기술적인 한계와 투자비용에 대한 부담으로 개발을 전면 보류하거나 중단을 했습니다.
90년 초부터 96년까지 번역 프로그램들이 한때의 유행병처럼 번지다가 사용자들의 외면 속에 사장되다시피 했습니다.
근데 이런 번역 프로그램이 최근에 다시 고개를 들고 있습니다.
인터넷이라는 새로운 전기를 맞으면서인데 기존 텍스트 위주의 번역 기능에 인터넷 홈페이지를 실시간으로 번역할 수 있는 기능들을 추가한 제품들이 봇물을 이루고 있습니다.
지난해 8월 언어공학연구소와 드림씨엔씨가 트래니'98과 E-Tran'98을 나란히 출시한데 이어 미래소프트센터와 첨단공학소프트센타도 미래번역트랜스 II와 매직 A+2000을, 유니버셜소프트정보통신과 엘엔아이소프트, 테크노매직 등도 한마당과 인가이드, 매직박스'99 등을 올해 초 각각 선보였습니다.
정소프트도 이달 중으로 워드체인지 5.0의 출시를 계획하고 있다.
그러나 문제는 이들 제품들이 대부분 기준 미달이라는 데 있습니다. 성능적인 측면에서는 지난 90년대 초에 출시된 제품들과 별반 다를 것이 없고, 인터넷 기능이 새로 추가돼 있다고는 하지만 이 역시 제 기능을 다하지 못하기는 마찬가지인 것입니다.
인터넷 홈페이지는 대부분 단문 형태로 채워져 있어 번역률이 높을 것으로 생각하지만, 현실적으로는 일반 텍스트 번역 기능보다도 못합니다.
함축적이고 은유적인 글들이 많아 문장의 뜻을 충분히 파악하지 못하면 번역 자체가 안 되는 것입니다.
기존 텍스트 번역 기능 수준에서 접근하다보니 성능이 떨어지는 것입니다.
특히 웹 브라우저를 비롯해 인터넷 관련 기술들은 하루에도 몇 번씩 바뀌고 있습니다. 그러나 관련 기술력을 충분히 갖추고 있지 않은 업체들이 제품 상용화에만 관심을 두다 보니 전체적으로 성능이 떨어지고 있습니다.
최근 출시된 제품들을 인터넷 상에서 사용해 보면 텍스트 번역 수준은 말할 것도 없고, 홈페이지 곳곳이 깨져 보이는 이유가 바로 여기에 있는 것입니다.
그러나 제품 성능보다 더 큰 문제는 이들 업체들의 영업에 있습니다.
제품이 제 기능을 발휘하지 못하면 제품 자체를 팔지 말아야 하는 것도 상도의상 기본입니다.
그러나 아주 기본적인 기능조차 제공되지 않는 제품이 시중에 버젓이 팔리는 것은 문제입니다.
또 성능 개선이 전혀 이루어지지 않은 제품이 이름과 포장지만 바뀌어 판매되는 것도 문제입니다.
일례로 지난 96년 설립된 미래번역소프트센타는 지난 한해에만 제품 이름을 3번 이상 바꿨던 것으로 알려집니다.
설립 당시에는 세종대왕이라는 제품명을 써왔으나, 지난해 2월 미래번역 98+로 바꿨다가 다시 그 해 9월 미래번역트랜스로, 또 불과 한 달만인 10월에는 다시 미래번역트랜스 II로 제품명을 변경했습니다. 이 회사는 5명 가량의 직원들이 있는데 그 어렵다는 영한 번역 프로그램을 몇 달이 멀다하고 새롭게 출시한 것입니다.
미래번역소프트센타측은 이에 대해 제품명이 이렇게 자주 바뀐 것은 단순히 영한번역기능만 있던 기존 제품에 한영번역과 인터넷 지원, 토익 프로그램 등과 같은 기능들이 추가되면서 제품명을 바꾸게 되었다고 해명합니다.
그러나 제품 성능이 크게 개선된 것도 아니고 새로울 것도 없는 기능이 추가된 제품을 마치 새로 개발한 최신의 제품인양 판매하는 것은 정말 문제입니다.
실제로 미래소프트센타가 지난해 9월에 출시한 미래번역트랜스와 한달 뒤에 출시한 미래번역트랜스 II 제품을 본지가 직접 벤치마크테스트 해본 결과 번역 내용이 단 한자의 오차도 없이 동일하게 나타난 것으로 밝혀졌습니다.
기능상 개선이 전혀 이루어지지 않았음을 알 수 있었던 것입니다.
또한 미래번역소프트센타가 내세우는 한영 번역 기능도 영한 번역에 비해 크게 눈에 띄는 기능이 없었습니다.
영한 번역 기능을 마치 거꾸로 업어 놓은 듯한 수준의 번역 기능만을 제공했습니다.
인터넷 홈페이지 번역 기능은 말할 것도 없고, 토익 프로그램은 자체 개발한 것이 아니라 한울미디어라는 업체의 영어학습프로그램을 라이센스 받아 추가한 것으로 알려졌습니다.
통상 어떤 제품이 부분적으로 기능이 향상될 경우 기존 구매자를 보호한다는 차원에서 무료로 업그레이드됩니다.
기능 추가로 제품명을 바꾸었다는 미래번역소프트센타의 해명이 설득력이 없다는 얘기입니다. 미래번역소프트센타의 영업도 문제로 지적됩니다.
미래번역소프트센타는 미래번역트랜스 II의 제품 가격이 40만원이라고 명시해 놓고, 실제 시중에서는 '홍보 기간내 특별판매 실시'라는 명목으로 일년내내 3만원에 판매하고 있습니다.
SEK와 같은 컴퓨터 관련 행사장에서는 1만원에 판매하는 것도 예사입니다. 40만원짜리 제품을 3만원이나 1만원에 판다면 누구나 한번쯤은 구매 충동을 느끼게 될 것입니다.
매직A+라는 제품을 내놓고 있는 첨단공학소프트센타의 경우도 별반 다를 게 없습니다.
소비자 가격이 9만9천원인 이 제품을 홍보 특가라는 말을 내세워 5만원에 판매하고 있습니다. 각종 행사장에서는 1만원에 판매하는 것은 물론입니다. 행사장에서 판매하는 제품은 반품도 어렵다는 것입니다.
제품 하나가 돌고돌아 이외에 동일한 소스를 가진 제품이 여기저기에서 판매되고 있는 것도 문제점입니다. 업체와 제품명만 다를 뿐 인터페이스와 기능이 거의 유사한 제품들이 시중에 판매되고 있다는 것입니다.
'무늬만' 다를 뿐 내용은 똑같은 제품이 마치 새로운 제품인 양 시중에서 판을 치고 있는 것입니다.
일례로 지난 97년까지 시중에 판매되던 대표적인 영한 번역 프로그램인 꼬마천사와 번역마당 등은 정소프트의 워드체인지를 기반으로 만들어진 제품으로 알려져 있습니다.
정소프트의 워드체인지 개발자 가운데 한 사람이었던 전 모씨가 퇴사 후 꼬마천사라는 제품을 만들어 판매하다가 다시 유진정보기술로 들어가 번역마당이라는 제품을 만들었다는 것입니다.
그러나 유진정보기술 유경열 사장은 번역마당 3.0 버전 출시를 끝으로 더 이상의 성능 향상은 어렵다고 판단해 제품 개발 포기를 선언, 전 모씨는 유진정보기술을 떠나 다시 대구지역으로 내려가 또 다른 이름의 제품을 만들어 영업을 했던 것으로 알려집니다.
한편 유진정보기술 유 사장은 제품 성능이 형편없는 제품을 계속 판다는 것은 사용자들을 속이는 일인 것 같아 개발을 중단하게 되었다고 당시를 회상합니다.
미래번역소프트센타와 첨단 공학소프트센터도 따지고 보면 한 줄기에 속합니다. 미래번역소프트센타의 전 영업실장이던 긴태국씨가 첨단공학소프트센타라는 회사를 설립한 것입니다.
첨단공학소프트센타 김태국씨는 3A소프트웨어 박철 사장과 자신이 공동으로 개발한 제품이 매직A+라고 소개하고 있지만 김태국씨는 소프트웨어 개발과 관련된 어떠한 경력도 없다는 점을 감안하면 이를 그대로 받아들이기에는 무리가 있습니다.
미래번역소프트센타의 이 남 사장 역시 김태국씨가 자사 제품을 이용한 것 아니냐는 의심을 보이고 있습니다. 누구의 이야기가 맞는 지는 모르지만 두 사람 모두 엔지니어가 아닌 이상 제품을 자신들이 개발했다는 것은 믿기 어려운 일입니다.
한국IBM의 앙꼬르와 서울대 자연어처리 연구실에서 개발한 E-Tran'98도 개발자만을 놓고 보면 같은 부류에 속한닫고 볼 수 있습니다.
한국IBM과 같이 앙꼬르 개발에 참여했던 서울대 자연어처리연구실 김영택 교수가 최근 드림씨엔씨로부터 자금 지원을 받아 E-Tran'98을 개발했기 때문입니다.
즉, 앙꼬르의 후속 버전이 E-Tran'98이라고 해도 과언이 아닐 것입니다.
이와 관련 김 교수측은 앙꼬르 개발 노하우가 E-Tran'98을 개발하는데 도움은 됐지만, 엔진 자체는 앙꼬르와는 전혀 다르다고 주장합니다.
그러나 한국IBM은 김 교수가 지난 15년간 앙꼬르 개발에 참여해 온 만큼 앙꼬르를 완전히 배제한 상태에서 E-Tran'98을 개발하지는 못했을 것이라며 김 교수측에 불만을 토로했습니다.
한국IBM은 지난 86년 영한 번역 프로그램 개발 프로젝트를 세우면서 서울대 김영택 교수에게 수백억원짜리 수퍼컴퓨터와 개발비용을 지원했으며, 때에 따라서는 일본IBM에 소속돼 있는 번역 프로그램 관련 엔지니어들과 상호 교류도 성사시켜 줘 김 교수가 제품을 개발하는데 도움이 될 수 있도록 모든 지원을 아끼지 않았었다고 합니다.
그러나 제품의 성능이 당초 예상했던 것보다 훨씬 뒤쳐지는 것으로 나타나자 개발을 잠시 보류한 상태에서 김 교수가 다른 업체와 손을 잡고 유사 제품을 만든 것은 엄밀하게 따져 지적재산권을 침해한 것이나 다름없다며 불편한 심기를 드러냈습니다.
이런 정황을 미루어 짐작해 보면 국내 영한 번역 프로그램은 크게 2~3개 제품이 가지를 치며 10여개 이상의 제품을 만들어냈다고 할 수 있습니다. 제품 성능이 하나같이 뒤쳐있는 것은 말할 것도 없습니다.
상황이 이렇다 보니 지적재산권 문제로 이들 업체들간 옥신각신하는 예도 많습니다.
그러나 현행법상 소스코드의 30%만 다르면 독자적인 제품으로 인정해 주고 있고, 모두가 약점이 있어 지적재산권 침해 여부를 가리는 데 적극 나서지는 못하고 있습니다.
업계 관계자들에 따르면 소스코드 30% 정도라면 똑같은 제품이라도 인터페이스 몇 가지만 바꾸면 문제가 없습니다.
번역 프로그램이 난립하게 된데에는 정부의 지원책에도 잘못이 있다고 볼 수 있습니다.
정부는 그동안 번역 프로그램을 개발하는 업체들을 대상으로 정보화촉진기금 지원 사업을 벌여왔던 것입니다.
번역 프로그램을 개발한다고 하면 우수신기술 지원사업으로 선정해 지원금을 장기저리로 대출해 주었던 것입니다.
국내 번역 프로그램을 개발하고 있는 업체 대부분이 이 자금을 받은 것으로 알려집니다.
그러나 전문가들은 번역 프로그램은 벤처업체가 손을 대기에는 너무 방대한 사업이라고 주장합니다.
미국이나 일본, 유럽 각국이 지난 40여년간 수천억원을 들여 개발을 시도하고도 아직 이렇다할 개발 성과물을 얻지 못한 사업이라는 얘기입니다.
늦기는 했지만 정부가 연구기관들을 대상으로 번역 프로그램 개발 지원 자금을 제공하는 것은 다행입니다.
올해 초 번역 프로그램 개발명목으로 ETRI에 14억원의 국책자금을 지원했습니다.
ETRI 중심으로 추진되는 이 프로젝트에는 엘엔아이소프트, 창신소프트, 유니소프트, 정소프트, L&C, 제일씨엔씨, 한국마이크로소프트 등 7개사가 현물투자 방식으로 개발에 공동 참여하게 됩니다.
또 한국과학기술원(KAIST) 김길창 교수진은 공군의 의뢰를 받아 군사관련 장비 매뉴얼을 번역할 수 있는 프로그램 개발에 들어가 있다. 또 한국과학기술원 최기선 교수진과 일본 NTT, 싱가폴 KRDL 등 3개국 연구기관이 참여하는 국제공동연구 프로젝트도 추진하고 있습니다.
이들 3개국은 인터넷 홈페이지를 다중 언어로 번역할 수 있도록 하는 프로그램을 개발하는 것을 목표로 삼고 있습니다. 정부 주도의 개발 창구가 단일화되지 못한 아쉬움은 있지만, 이번 ETRI 프로젝트처럼 각개 전투식으로 개발을 추진해 왔던 민간기업과 연구기관을 한데 묶어 지원한 것은 그나마 다행입니다.
최근 대규모 자본력을 앞세운 선진 외국기업들의 동남아 시장 진출이 활기를 띄고 있다고 합니다.
동남아 업체들이 외환위기로 투자를 늦추고 있는 사이에 번역 프로그램의 현지화를 위해 투자를 늘리고 있다는 것입니다.
특히 벨기에의 LNH라는 회사는 이미 국내에 지사까지 설립해 놓고 자국어와 한글을 실시간으로 번역할 수 있는 프로그램 개발을 추진하고 있는 것으로 알려져 있습니다.
제품이 개발되면 엄청난 수익이 보장되는 확실한 사업인 만큼 투자를 게을리 하지 않고 있는 것입니다. 21세기 새로운 국가 경쟁력 도구로 부상하고 있는 번역 프로그램에 대해 정부차원의 투자와 개발지원 확대가 아쉽습니다.
제 의견에 반박하실 분은 반박해도 좋습니다. 하지만 아마 제 말에 거의 다 동의를 하실 겁니다. 그럼 이만. from 영어번역사를 꿈꾸는 박영현