TM의 의미? -- ('번역료가 계속...'에 이어)

카페 게시글

자유 게시판 TM의 의미? -- ('번역료가 계속...'에 이어)

밀레. 추천 0 조회 1,891 15.12.11 21:40 댓글 9

게시글 본문내용

다음검색

저작자 표시 컨텐츠변경 비영리

살다보면
15.12.12 10:27

첫댓글 전 세계에 있는 TM에 축적된 data가 얼마나 될까요. 전 세계에 존재하는 기존의 문장 갯수는 몇개나 될까요?
사하라 사막에 있는 모래알을 다 합친 수보다 클까요? 태평양 바다에 존재하는 물분자의 갯수보다 클까요? 지구상의 모든 원자(수소, 산소, 질소, 나트륨, 염소, 저는 화학 전공자가 아니라서 잘 모르지만)를 다 합친 수보다 클까요?
지구를 넘어 전 우주의 원자를 다 합치면 그 수가 대략 10^80~90(동그라미 갯수가 80~90개 정도된다는 의미입니다) 정도 된다고 하네요.
살다보면
15.12.12 10:43

겨우 45개의 숫자 중에서 6개의 숫자를 추출하여 만들어 낼 수 있는 경우의 수가 약 800만개나 되죠(이게 로또입니다.)
그렇다면, 예를 들어 45,000개의 단어 중에서 20개의 단어를 추출하여 만들어 낼 수 있는 경우의 수는 몇개나 될까요? 약 10^73개(1에 동그라미가 73개) 정도 됩니다.
(문장은 1개의 단어로 만들 수도 있고 20개가 넘는 단어로 이루어진 문장도 있고 한 문장에 같은 단어가 여러개 나올 수 있고, 단어의 순서가 바뀌면 또 다른 문장이 되므로 사실 이보다도 훨씬 더 큰 수가 나오겠죠.
저는 수학 실력이 딸려서 거기까지는 계산하기 힘드네요. 여하튼, 이론적으로 만들 수 있는 문장의 갯수는 말 그대로 무한하다고 합니다
살다보면
15.12.12 10:37

@살다보면 기계번역 해 놓은 것을 편집해 달라는 의뢰를 받은 경험이 있습니다. 하다가 중간에 던져 버렸습니다.
문장 토막내서 구글번역기 입력하고 편집해보진 않았지만 아마 그 짓거리 하는 것보단 아예 처음부터 직접 번역하는 것이 훨씬 시간 단축될 것이라고 생각합니다.
기계가 번역한 것을 최종 확인하는 것이 과연 어느 정도의 노력을 필요로 할까요?
도저히 감수할 수 없는 수준 즉, 오역율이 20% 이상인 것은 폐기하고 다시 번역한다고 하죠. 80%가 아깝지 않나요. 왜 그럴까요?
차라리 다시 번역하는 것이 더 효율적이기 때문입니다.
구글번역기 오역율은 몇%나 될까요? 그야 알 수 없지만 아마 20% 안으로 들어오긴 힘들겁니다.
살다보면
15.12.12 10:32

@살다보면 기계는 사진을 찍습니다. 정말 정확하죠. 똑같습니다. 순식간에 똑같은 모습을 담아냅니다. 사람이 똑같이 그려낼라면 며칠 걸릴 텐데요.
사람이 몇 달 걸려 계산 할 것을 기계는 몇초만에 해치웁니다. 입이 딱 벌어질 일이죠. 촛불만 보다가 처음으로 전깃불을 본 사람처럼 말이죠. 세상에 어찌 이런일이 하면서요.
기계가 달나라를 넘어서 화성까지 가니마니 하니, 세상에 기계가 못할 일은 아무것도 없는 것처럼 보입니다.
잘 아시다시피 언어는 기호입니다.. 빨간불은 정지, 파란불은 진행. 이게 기호입니다. 기호들을 하나둘 만들기 시작해서 그것이 언어가 된 것입니다. 아빠, 엄마, 해, 별, 바람, 비, 눈, 사과, 배, 호두, 호랑이, ...
살다보면
15.12.12 10:34

@살다보면 기계는 사진을 찍지만 사람은 언어로 표현합니다. 정확도와 시간은 단연 카메라가 우수하겠죠. 그러나, 사람이 언어로 표현한 문장과 카메라로 찍어낸 사진은 차원이 다르죠.
사진은 그대로 담아낸 것이지만, 문장은 사람이 기호를 가지고 만들어 낸 것입니다 (어제 저녁에 어떤 초등학생이 쓴 짧은 일기 한 편이 노벨문학상 수상작품보다 더 훌륭하다고 주장할 수도 있는 것입니다..)
주어진 기호를 가지고 각자 나름대로 만들어낸 문장을 기계가 이해하기는 어렵습니다.
살다보면
15.12.12 10:35

@살다보면 그래서 기계는 문장을 스스로 이해하는 것을 포기하고 통계적 기법을 사용하는 것 같습니다.(기계의 막강 능력을 이용해서 그깟 문장, 만들 수 있는 문장을 모조리 다 만들어놓고 빼내어 쓰지 뭐, 그런데 그 수가 장난이 아니죠, 말 그대로 무한한데,)
그런데 문장이라는 것이 워낙에 풍부해서 통계적 기법이 과연 얼마나 효과를 낼지......
번역김
15.12.12 13:01

기계는 그냥 직역입니다.한개단어가 여러가지 뜻이 있는데 상황에 따라 그뜻이 바뀌죠 기계는 그냥 그중의 한뜻을 가져다 번역합니다.기계나 화확 분야의 번역정화도는 어느정도 되곗지만 다른 분야는 오역률이 엄청 심하죠.
편하게
15.12.15 11:24

구글 번역을 사용해본 적이 있는데,기계번역치고는 아주 훌륭했습니다. 10년 후에는 굳이 번역회사가 필요 없는 시대가 되지 않을까 하는 불안한 맘이 들 정도로. (번역을 노후 직업으로 생각하고 있음)
밀레.
작성자 15.12.16 06:32

노후까지 계획하신다면, 장기적으로 통합(자동)번역이 차지할 영역과의 차별화에 관심을 두시면 좋을 듯하군요..