|
출처 : https://www.fmkorea.com/6766057423
오늘 게시판에 중국과 일본의 사례를 이야기하면서
한글이 전산화에 적합하다는 점에서 우수성을 설명한 글이 있었어
그런데 '한글은 전산화에 적합한 문자다' 라는 신화와 달리
기계화와 전산화 과정에서 상당히 고생을 했었기에
이 점에 대해 글 작성자분의 동의를 얻어서 글을 써보려고 해
물론, 학창시절 귀에 못이 박히도록 들었겠지만
한글은 자음과 모음이 조합하여 문자를 이루는
규칙적이고 직관적인 문자인 건 분명해
그렇기에 한자를 사용하는 중국이나, 한자와 가나를 사용하는 일본에 비해서
'상대적으로' 기계화와 전산화에 수월했던 건 사실이야
중국이나 일본은 이 정도 난이도였었으니까
하지만 한글의 기계화나 전산화는 결코 쉬운 과정이 아니었어
한글 자모가 24개 밖에 되지 않아서 알파벳보다 적은데
뭐가 어려웠다고 엄살을 부리냐고 할텐데
엄살이라고 하기에는 글자 수가 '너무나도' 많았다는 게 문제였지
한글은 초성 + 중성 + 종성을 '모아쓰는' 글자라서
기계화나 전산화를 하기 위해서는
초성 19자 X 중성 21자 X 종성 27+1(종성이 없는 글자도 있으니까)
를 조합한 숫자만큼 글자가 필요했거든
그러니까 이를 위해서는 19 X 21 X 28 = 11,172 개의 글자가 필요했던 거야!
이러한 11,172자의 숫자도
20세기 이후 사용 빈도가 낮은 자모들이 날아갔으니 그나마 이 수준이지
옛한글을 조합식으로 만들면 100만자가 넘는 상황이었어
이러한 상황이었음에도 한글을 알파벳처럼 풀어 쓸 수도 없던 상황이었지
훈민정음 반포 직후 한자음을 한글로 정리하기 위해 편찬된 동국정운에서
중국의 성모와 운모 체계를 수용하는 대신
초성과 중성, 종성 조합으로 한자음을 설명한 걸 보면
한글은 훈민정음 창제 당시부터 초성+중성+종성 조합으로 만들어진 거였으니까
실제로 20세기에 알파벳의 영향을 받아서
한글도 모아쓰기 대신 풀어쓰기를 하자는 운동이 일어났음에도
별다른 영향을 끼치지 못하고 사라졌던 게
단지 '익숙한 것을 없애고 새로운 시도를 한다' 라는 거부감에 묻힌 게 아니라
비록 기계화와 전산화에는 모아쓰기가 불리할지언정
모아쓰기가 가독성에서 훨씬 유리하다는 실용성 때문에
풀어쓰기가 이에 대항할 지지 세력을 얻지 못한 거였어
그렇기에 지난날 우리 조상님들이
세계에서 최초로 금속 활자를 개발했음에도
이렇게 수많은 활자들을 제작해서 한자 한자 일일히 찾아서 넣어야 했기에
불편함으로 인해 구텐베르크의 금속활자 개발과 달리 큰 사회적 여파를 만들지 못했지
실제로 구텐베르크는 금속 활자 뿐만 아니라
대량 인쇄에 적합한 시스템을 만들었다는 점도 있지만
어쨌든 대중들이 손쉽게 출판물을 접할 수 있게 되면서
대중 중 '똑똑해진' 이들이 식자층과 시민계급을 형성하고
이들이 상업혁명, 과학혁명, 시민혁명의 기반이 되었다는 점에서
우리 입장에선 많이 아쉬운 부분이야
어쨌든 이렇게 한자 뿐만 아니라 한글 역시 글자 수가 너무 많았기에
서구보다 먼저 활자를 개발했음에도 이를 널리 실용화 하지 못했다는 점은
기계화나 전산화를 진행하는데 커다란 장애물로 작용했어
다만 그럼에도 불구하고 대다수 사람들이 이를 잘 알지 못하는 건
일반인들에게 보급될 시점에는 중국과 일본과 달리
해당 문제가 해결된 상태였기에 그래
예를 들어 한글의 기계화는 이미 해방 직후에
공병우 박사에 의해 사실상 완성된 상황이었는데
이는 초성+중성+종성의 11,172자의 글자를 타자기가 소화할 수는 없으니까
타자기는 각각 초성, 중성, 종성을 따로 따로 입력하게 하되
자판을 세벌식으로 만들어서 초성과 중성 종성을 지정된 위치에 타이핑하게 만들어서
우리 눈에는 초성, 중성, 종성이 모여져 있는 것으로 보이게 만든 방식이었어
실제로 한글 타자기로 글자를 입력하면 이런 결과물이 나오는데
눈썰미가 좋은 사람들은 초성과 중성 종성의 위치가 조금 부자연 스러운 걸 눈치챘을 거야
물론, 이러한 사소한 단점이 있었어도 공병우 박사의 타자기는
동아시아권에서 유일하게 서구 타자기들과 비견될 생산성을 가진 제품이었어
그러다보니 6.25 직후 서울을 점령한 인민군들이
정판사 위조지폐 사건에서 경찰이 고문을 행하지 않았다고 소견을 내린 의사들을 끔살할 때에도
한글 타자기의 가치를 알아보고 '선생님 새로운 세상에서는 선생님 같은 분이 필요합니다' 라고
어떻게든 공병우 박사를 전향시키려고 할 정도였었지
이 정도로 한글의 기계화는 공병우 박사 덕분에 가능했다고 해도 과언이 아니야
실제로 북한의 경우 공병우 박사의 한글 타자기 실물을 접했음에도
구동 원리를 파악하고 카피하는데 거의 10년이 걸렸다고 할 정도였으니까 말이야
하지만 기계화 과정에서는 어차피 기계로 타이핑을 해도 사람이 인식하는 거니까
초성, 중성, 종성 조합을 각각 따로따로 입력하고 모아쓰기처럼 인식하게 하는 '꼼수'가 가능했지만
전산화는 이야기가 달랐어
융통성이라곤 하나도 없는 컴퓨터에
11,172자의 한글 글자들을 모두 넣어야 하는 상황이었거든
물론 이러한 문제는 서구권에선 고생 좀 하긴 했어도 큰 문제는 되지 않았어
알파벳은 어차피 영어 기준 26자 뿐이고 대소문자 구분해도 52개라서
자잘한 특수문자를 넣어도 7비트로 담을 수 있는 128개로 충분히 구현 가능했거든
이런 아스키 코드가 나온 게 벌써 60년도 전이었었고
알파벳을 쓰고 있는 국가에 따라 움라우트나 다른 기호를 쓰는 경우에도
256개의 기호로 구성된 8비트 확장 아스키 코드 내에
자신들이 필요한 기호를 넣을 수 있어서 문제가 되지 않았어
근데 동아시아권에서는 그게 아니었다는 말이지
지금 유니코드 상에 들어가 있는 한자만 하더라도 10만자에 육박하고
현대 한글만 하더라도 11,172자에 달하는 상황이어서
이걸 어떻게 구현할 것인지에 대해서 그야말로 뒷목 잡는 상황이었어
이런 상황이다 보니 일각에서는 전산화를 위해
'굳이 11,172자의 완성형에 목을 맬 이유가 있습니까?' 라며
'이 참에 깔끔하게 조합형으로 갑시다' 라고
슬그머니 조합형 츄라이~ 츄라이~ 를 시도했지만
씨알도 먹히지 않았지
높으신 분들이나 여론 모두 모아쓰기를 원하는 상황에서
오늘날 교통카드 급의 연산능력을 가진 70~80년대 컴퓨터 사양으로
11,172자의 글자를 넣는 건 도저히 불가능했고
1987년에는 이에 대한 타협책으로
일상 생활에서 주로 쓰이는 2350자만 선별하여
이것만 전산화 하자는 '절충안'인 KS X 1001 이 마련되었어
물론 그 이전에는 그런 것조차 없어서
청계천에서는 허큘러스 그래픽 카드를 마개조해서
롬에다 한글을 저장해놓은 '청계천 카드'를 만들어서 팔았는데
그게 20만원 정도 하다가 보급이 되고서야 10만원 정도로 내려왔다고 해
80년대 초 기준으로 공무원 월급이 10만원 가량이었으니
한글을 컴퓨터에서 보는 게 얼마나 어려운 상황이었는지 알 수 있을 거야
KS X 1001 이 마련되면서 일상적으로 쓰이는 글자들은 컴퓨터에 담을 수 있었지만
한글 완성형 조합은 11,172자인데 2,350자 밖에 담지 못한 건 문제가 많았지
당시 PC 통신에서는 이에 대한 말이 항상 나왔고
힙스터들은 이 때다 싶어서 '이런 문제 없는 조합형이 우수하다!' 라고 불을 지피는 상황이었지
하지만 정부 입장에서는 이미 정부가 중재해서 마련해놓은 산업 표준안이 KS X 1001이었던 만큼
이걸 뒤엎어 버리면 컴퓨터 분야에서 후폭풍이 만만치 않을테다가,
정부 체면과 신뢰도가 타격을 입을 거라는 점에서
일본의 PC-9801 처럼 뭔가 잘못된 건 맞는데 그렇다고 이걸 어떻게 할 수 없는 총체적 난국이었어
물론 컴퓨터 사양은 무어의 법칙처럼 나날이 놀라울 정도로 발전했기에
90년대 초중반 시점에는 이미 하드웨어적으로 완성형 한글 11,172자를 모두 지원하고도 남는 수준이었지
하지만, 산업 표준이 정해진 상황에서 누가 이거 무시하고 총대를 맬 수 있는지가
고양이 목에 방울 달기마냥 어려운 상황이었는데
그걸 마이크로소프트가 한 거야
마이크로소프트가 윈도우를 내놓으면서 코드 페이지 949를 내놓았는데
거기에 완성형 한글 11,172자를 모두 지원했기에
더 이상 컴퓨터에 완성형으로 모든 글자를 담는 게 문제가 아니라는 걸 보여주었지
그렇기에 정부에서도 2,350자 밖에 담지 못하는 KS X 1001 을 고수하기보다는
11,172자 모두를 담을 수 있는 새로운 표준을 만들려고 했는데
문제는 이 때 이미 사실상의 국제 규격인 유니코드가 제정된 상황이었다는 거였어
유니코드에는 KS X 1001을 참고하여 2,350자만을 집어넣은 상태여서
심각성을 파악한 한국 정부에서 유니코드에 교섭한 결과
완성형 한글 11,172자 중 현재 유니코드에 들어가지 않은 나머지 글자들은
추후 유니코드 2.0 제정 당시에 별도의 영역에 넣어주겠다는 답변을 받았는데
문제는 이렇게 되면 글자 순서가 뒤죽박죽이 되어서 소팅 할 때 꼬인다는 점이었지
물론 공돌이들 갈아 넣으면 소팅하는 거야 해결이 가능했지만
한국 정부 입장에서는 이렇게 뒤죽박죽으로 꼬이면 좋을 거 없다는 생각에
유니코드 상대로 집요하게 요구를 한 결과
유니코드에서는 2.0 버전에서 한글 위치를 통째로 새로운 영역에 배정하고
한국 정부가 원하는 순서대로 배정을 해줬다고 해
물론 이 결과 버전이 변하더라도 문제 없이 호환될 수 있도록 만들어진 취지가 훼손이 되어
유니코드 1.0과 유니코드 2.0 이후 버전이 서로 호환이 되지 않게 되었고
한국 정부에게 호되게 당한 유니코드에서는 다시는 이러한 일이 생기지 않기 위해
'한 번 할당된 문자는 절대로 옮기지 않는다' 라고 원칙을 세우고
이후 다른 나라에서 비슷한 요청을 할 때마다 단호히 거부하는 중이야
실제로 한자의 경우 중국, 일본, 한국 공통 한자라는 의미로 CJK Unified Ideographs 라고 표기하는데
훗날 베트남이 '우리도 한자를 쓰니 해당 영역 이름을 CJK가 아니라 CJKV로 바꾸어 달라' 고 요청한 건
해당 원칙을 내세운 유니코드에 의해 바로 거부당했어
그리고 북한의 경우 같은 한글을 쓰긴 해도 글자 배열 순서가 다른 데다가
특히나 김씨 부자의 이름을 관리하기 위해 별도의 코드를 요청했는데
영화 '아이언 스카이' 에서 나왔던 장면마냥 비웃음만 당하고 무시당했다고 하더라
물론 북한은 이렇게 무시당하자 자기네 자체 전산망에는
한글 유니코드 배열을 자기네 순서대로 바꾸어서 개조해서 쓰고
김씨 일가 이름들은 자동으로 볼드 및 특수 처리하게 하도록 쓴다고 하는데
만일 한국이 먼저 조치를 취해서 망정이지
북한이 먼저 저 공밀레 수준으로 난리를 쳤으면 어떤 결과가 벌어졌을지 모르지
그리고 한국 정부에서는 유니코드 2.0에서 한국 정부의 주장을 관철시킨 다음
산업 표준으로 KS X 1005-1을 제정하였는데
정작 요즘에는 유니코드 대신 UTF-8을 많이 쓰고 있고 있는 현실이야
물론 UTF-8의 경우 글자 하나당 3바이트씩 먹고 있긴 한데
조합형이 아니라 완성형이라는 점에서
전산화 과정에서 조합형 vs 완성형 논쟁이 의미 없는 건 아니었겠지
한글이 기계화와 전산화가 순조로웠다는 건 위에서 적은 것처럼
근거 없는 '신화' 에 가까운 거고
일반인들이 그렇게 생각하는 건 일반인들이 기계화와 전산화를 접할 무렵엔
실 사용에서 별다른 문제가 없는 상태여서 그랬다는 내용을
내가 글 실력이 없어서 이렇게 길게 작성해서 미안하다
참고로 전산화 난이도 끝판왕이라는 중국과 일본도
요즘에는 IT 기술 발전에 힘입어서
불편함이 계속 줄어들고 있어
다만 그렇다고 해서 내가 하고 싶은 말은
'어차피 기술 발전하면 한중일 모두 별다른 불편함이 없어진다' 라는 시니컬한 주장이 아니라
그래도 지난 30년 가까이 별 불편함 없이 컴퓨터에서 한글을 사용할 수 있었던 점에서
한글 덕분에 중국과 일본보다 전산화를 앞서서 진행할 수 있었다는 점이야
모두 부족한 글을 끝까지 읽어주어서 고맙다!
유니코드 인코딩 방식이
UTF-16 대신 UTF-8로 바뀌었다고 써야할 걸
저렇게 잘못 적어서 미안해...
댓펌
타자기는 얼추 이해했는데 전산은 너무 어려워
서구 국가들은 알파벳 숫자가 적어서 60년대에도 이미 글자 표기에 문제가 없었는데
한국은 한글 완성형 글자가 11,172자에 달해서 당시 컴퓨터로는 이걸 다 넣지 못하고
80년대 중반에야 간신히 그 중에 많이 쓰이는 2350자를 넣고
90년대 중반에야 11,172자를 모두 넣어서 쓸 수 있게 되었다는 점이야
그리고 중국과 일본은 이제야 전산 입력의 불편함이 기술 발달로 줄어들고 있는 상황이라는 거지
오늘날 입장에선 글자 좀 많다고 저걸 컴퓨터에 못 넣냐? 고 할텐데
40년 전만 하더라도 빌게이츠가 '640kb 메모리라니 용량이 굉장히 많네요!' 라고 하던 시절이라
정말로 넣을 여력이 없어서 못 넣은 거야
개인적인 의문인데 한글파일이 유난히 버벅거리고 메모리 많이 잡아먹는 이유에 한글의 특성도 있는가? 연구 보고서 쓸 때마다 환장하겠음
아래아 한글이 스파게티 코드가 많아서 그렇다고 들었던 걸 보면
한글을 쓰고 있어서 버벅거리는 게 아니라 프로그램의 문제일 거야
흠... 아래아 한글이 문제였구만. 근데 정부는 아래아 한글만 쓰니까... 애휴 그리고 또 워드는 은근히 프로그램이 불편함.
당연히 정부 입장에서도 아래아 한글 불편하고 문제 많은 거 알겠지
군대 같이 빨리빨리 타이핑 해야 하는 곳이라면 아래아 한글 좋아하긴 할텐데
삼성도 훈민정음 포기한 시점에서 정부가 아래아 한글 버리면
한국시장은 바로 마이크로소프트 워드가 장악할 판이라 울며 겨자먹기로 써주는 듯 싶어
문제 많긴 해도 국산기업 vs 국제표준이긴 한데 남의 나라 초대형 기업 구도라
정부 입장에선 후자 편들기가 쉽지 않을 듯
그럼 저게 옛날에 우리나라에서 아래아한글이 MS워드보다 보편적으로 쓴 이유 중에 하나인거임?
옛날에 아래아한글이 한국어 지원이 잘된다고 쓰던게 지금까지 쓰는거라든데
일단 국문학자들은 좋아하긴 하는데 그 이유보다는
한국시장에 워드가 90년대 초중반에 들어와서일 거야
소프트웨어 산업 특성상 경로 의존성이 강한데
아래아 한글이 이미 80년대 후반에 출시되어 선점한 상황이니
아무리 마이크로소프트가 판매하려고 해도 관공서 지원 업은 한글 상대하긴 힘들지
특히나 군대에서는 작업 속도 때문에 아래아 한글 쓰니까 행정병 출신들은 사회 나가서 아래아 한글 쓸 거고...
폰트 회사 입장에서 한글은 여전히 빡센 문자시스템임
한글 폰트 만들려면 1만자가 넘는 한글 조합 전부를 세팅해줘야 함
그래서 90년대엔 사용빈도 99.9%를 커버하는 한글 2000여자의 폰트만 만들었음
그것도 빡센데 일각에서 "똠" "펲" 과 같은 글자를 구현할 수 없다고 아우성이 많았음
그 이후 폰트회사가 여기저기 생기면서 그냥 조합 가능한 10000여자의 모든 한글을 디자인하게 됐음
그래서 상대적으로 로마자나 가나문자 키릴문자 같은 자모 숫자가 수십여개에 불과한 문자들보다 폰트 디자인의 다양성이 한글은 한참 부족함
|
첫댓글 대박 완전 흥미돋
와 진짜 흥미 돋고 재밋다
가끔 꿿 이런거 지원 안되는 폰트있던데 이런맥랃이엿구나 ...
흥미롭다 알파벳 쓰는 선진국의 빠른 발전에 전산화도 큰 기여를 했구나.. 그리고 폰트도 일일히 바꿔야하다니 몰랐어
아니 그럼 북한에서는 어떤 폰트로나 어디에서나 김씨네 이름 타이핑하면 특수 효과 적용이 저절로 된다는 것??
한글 보편화에 힘써주신 모든 분들께 감사를 드립니다..
와 개신기하다.. 중간에 사실 반은 못알아들은것 같지만 흥미롭고 재밌어
크으
와 인코딩 ms949 궁금했는데 이런 사유로 개발된거구나 신기하다
너무 재밌어서 기절했어.....
오 너무신기해!!!