강의와 자료
연구 과제
학술 발표
[English Version] |
목차 |
한글 정보화의 목표 한글 정보화의 수준 디지털 정보로서의 한글 정보통신기기와 한글 정보화 현황: 입력/ 부호계/ 출력의 정보화 문자 환경과 '정보 한글' 우리 시대의 문자 환경 과제: 자판 개발/ 한글 코드/ 한글 출력 문제: 한글의 세계화/ 부드러운 글쓰기/ 문서 환경 |
한글 정보화의 목표
- 훈민정음의 취지: (문서를 통해서) 자신의 뜻을 손쉽게 표현할 수 있게 하는 것.
- 정보한글의 목표: (정보통신기기에서) 자신의 뜻을 손쉽게 표현할 수 있게 하는 것.
- 정보통신기기 : 컴퓨터 + 통신기기(휴대전화, PDA)
- 통신 채널의 변화, 통신 매체의 변화
- 종이: 저렴성, 표현의 유연성, 활용의 보편성, 역사성, 고정성
- 정보통신기기의 문자 표현 매체적 특성:
- 비교적 고가이지만 점차로 저렴해지고 있다.
- 아직도 기계 기반의 경직성을 가지고 있다(전원 필요).
- 아직 완전한 보편성을 가지지는 못한다.(정보 격차)
- 기술 자체의 변화 발전 가능성이 있다.
- 한글 정보화의 세 가지 측면
- 표현 매체로서의 정보통신기기의 적응성
- 정보통신기기 상에서 한글과 문서의 표현과 처리의 편의성
- 정보한글을 사용하는 언중의 정보한글 능력
- 논의의 범주
- 한글 정보화의 세 가지 측면을 현황과 과제로 나누어 고찰
- 정보한글의 범위로 논의하고, 정보화 이후의 과제는 차후에 연구
- 우리말의 정보화(NLP 등)에 관한 것도 차후에 연구
한글 정보화의 수준
- 한글 정보화의 과정
- 한글 기계화(60,70년대) : 한글 타자기의 개발
- 한글 전산화(80,90년대) : 한글 문서처리기의 개발과 보급
- 한글 정보화(2000년대) : 정보통신기기에서 한글의 편의롭게 사용
- 현 단계는 한글 정보화의 성취 단계이며, 한글 정보화의 목표도 완성과정에 있다.
- 우리나라는 개인용 정보통신기기의 최대 생산국가의 하나이다.
- 자국에서 개발한 한글 소프트웨어를 사용하는 몇 안 되는 나라의 하나이다.
- 언중의 정보한글 능력도 세계적으로 상위에 속한다.
- 인근 국가와의 정보문자 활용 대비 1(중국의 경우)
- 문자 자체에 대한 문맹율이 여전히 높은 편
- 한자의 입력을 위해서 다양한 방법이 공존하며 아직 불편함
- 병음입력 방식: 영문 자판에서 한자 병음을 로마자로 입력, 변환, 선택(일반인용, 휴대전화용)
- 5필자모: 한자의 모양을 구회별로 나누어 지정된 부호를 입력, 변환(전문자용)
- 인근 국가와의 정보문자 활용 대비 2(일본의 경우)
- 가나의 직접 입력을 위해 자판의 문자 영역을 확대해야 함(숫자키 희생)
- 휴대용 통신기기에서는 영문 발음을 입력하여 가나로 변환해야 함
- '날로 씀에 편안케 하고자 함'이라는 세종대왕의 훈민정음 창제 목표.
- 세종대왕의 뜻은 당대에 성취되지는 못했지만, 근대의 과정을 거치면서 우리의 보편적 의사소통의 수단으로 자리잡았으며, 한글의 문화가 꽃 피어나게 되었다.
- '정보한글'이 바로 '오늘날의 훈민정음'이요, 세종대왕의 진정한 뜻이 이 시대에 성취되었다.
디지털 정보로서의 한글
- 문자는, 기의(signifié)의 기표(signifiant)를 기호체계로 적은 것이다.
- 단어의 지시대상은 아날로그적이고,
- 그것을 표기하는 문자는 디지털에 가깝다.
- 기호 체계를 가지고 있으며,
- 소리와 의미의 연속성을 샘플링하여 단계적으로 표시한 것이다.
- 만일 문자가 없다면, 언어를 컴퓨터에 입력하기 위해서는 소리 형식으로 할 수 밖에 없다. (이것은 정보화가 아니라 단순한 녹음이다.)
- 문자로 표현된(표현될 수 있는) 정보의 정보화는 아주 간편하다.
- 한글은 정보문자로서 훌륭한 작품이다.
- 소리글자로서, 문자 자체도 쉽게 익힐 수 있으며, 표현도 손쉽다.
- 기호 체계를 이루고 있는 구성 요소의 개수가 적고,
- 기호의 구성이 합리적, 확장적이다.(자모의 창제 원리)
- 기본적 도형의 결합으로 자형이 생성되며, 변별성을 가진다.
- 자음의 기본 도형(○ □ △), 모음의 기본도형( ? ㅡ ㅣ)
- 기호의 체계가 선명하며, 자판에서 오토마타가 손쉽게 구현된다.
- 이 점에 대해서는 한글 공학에서 많이 밝혀 놓았다.
정보통신기기와 한글 정보화
- 목표: 정보통신기기에서 입력, 처리, 출력에 이르는 일련의 과정을 한글의 특성에 맞게 처리하는 것.
- 정보통신기기와 한글 정보화의 범주
- 입력(entry): 입력도구의 설계, 자동 인식의 고품질화 등
- 자판, 음성인식, 문자인식(인쇄체, 필기체: 온라인, 오프라인)
- 부호계(code): 유니코드 환경에서의 한글 부호계 개발, 운용
- 출력(output): 시각적, 청각적 정보 출력의 지능화와 고품질화
- 화면용, 인쇄용 글자꼴(font)의 개발, 음성 합성
- 문자의 정보화와 한글 처리
- 문자를 최소 단위로 분해 후 디지털로 전환.
- 컴퓨터의 정보 단위(비트, 바이트, 워드)와 어울리게 표현.
- 조합형은 초중성 각 5비트로, 한글 음절 1자는 워드에 대응
- 조합형 코드표 한 장이면 11,172자(혹은 12,390자)를 자동 생성.
- 훈민정음 창제 원리의 상통해야 함(가획과 결합의 원리).
입력 정보화의 현황
- 컴퓨터용 자판은 표준2벌식 자판이 대표적이다.
- 보다 합리적이고 과학적인 자모 배열을 위한 연구가 진행 중이다.
- 운영체계(및 응용 프로그램) 상에서 여러 가지 자판을 선택할 수 있다.
- 남북이 하나로 합의한 자판이 제안되기도 했다.
- 인체공학적이고 한글공학적인 자판이 만들어지기도 했다.
- 옛한글 입력을 위한 자판이 오래전부터 사용되었다.
- 하지만, 표준2벌식 자판의 위력을 꺾기 힘든 형편이다.
- 현재 사용 중인 자판의 종류
- 운영체계(Windows XP)/ <아래한글> /
- 휴대전화기의 문자 메시지 전송을 위한 특수 자판도 몇 가지가 있다..
- 음성인식: 상품화되어 판매되고 있으며, 학습과정을 거치면 상당한 수준의 입력이 가능하다.
- 문자인식 : 오프라인 OCR도 꾸준히 개발되고 있으며, 환경이 맞을 경우 90% 이상의 인식 능력을 보인다.
- Windows XP에서는 필기체 온라인 인식 가능
부호계 정보화의 현황
- 문자 부호계의 발전 단계
- 전산화 단계: 개별 문자권마다 별도의 부호계가 존재
- 정보화 초기 단계: 국제 부호계와 관련성이 있으며, 그 제약을 받는 개별 문자 부호계 존재(KS C 5601-1997)
- 정보화 발전 단계: 유니코드 영역에 모든 문자들이 배치됨.
- 우리의 부호계 환경의 변화
- TG조합형-KS완성형-KSSM조합형-MS통합형-유니코드
- KSSM조합형에 바탕을 둔 의 확장 부호계가 통용된 바 있음.
- 현재는 유니코드의 '무늬'를 가지고 운영체계의 제약 가운데 MS의 지원을 받고 있는 형편임.
- 유니코드와 우리의 문자 표현
- 한글이, 완성형-조합형-확장영역의 옛한글 등으로 나뉘어 배치됨.
- 사용자는 큰 불편을 겪지 않지만, 원리적으로 바람직하지 않다.
- <아래한글2002 이후판>, , Internet Explore에서 옛한글 입출력 가능.
- 옛한글 처리 문제가 유니코드의 한글 처리에 많은 제약을 가하고 있음.
한글 출력 정보화의 현황
- 출력 정보화의 단계
- 비트맵 방식의 한글 폰트(화면용, 프린트용) 개발 단계
- 윤곽선 방식의 한글 폰트 고품질 개발 단계
- 유니코드 지원 및 출력의 지능화와 고품질화 단계
- 글자꼴(font)의 개발과 보급
- 민간 업체의 상업적 폰트 개발
- 다양한 폰트를 자체적으로 개발하며, 폰트 수출 경험도 있다.
- 문광부의 공공 폰트 개발
- 교과서체를 위한 표준 한글 폰트로 제정하려는 취지.
- ㅈ, ㅊ, ㅎ, ㅋ, ㄱ 등의 표준 서체 개발
- 본문, 제목용으로 개발되었으나, 잘 활용되지 않는다.
- 음성 합성의 현황
- 1990년대 중반부터 TTS 형태로 보급되고 있다.
- 장애인을 위한 것, 자연언어처리를 위한 것 등이 있다.
문자 환경과 '정보한글'
- 문자 환경은 변화 및 확대의 모습으로 변해 왔다.
- 훈민정음 창제 이전에는 한자와 이를 빌어 표기하는 이두만이 사용되었다.
- 훈민정음 창제로 고유어에 적합한 고유 문자 표기 체계가 만들어졌다. 이후 한글 전용, 한글 한자 혼용, 한자 전용의 문서가 작성되어 왔다.
- 특수한 분야에서는 몽골 문자나 일본 문자가 사용되기도 했다.
- 외국 문자는 역관들을 위한 학습서 등에서 표기되었다.
- 개화기와 일제 강점기에 이르는 동안 훈민정음의 자모 중 몇 글자가 사라지기도 하고, 일부 언어 연구를 위해서 변형된 자모가 만들어지기도 했다.([ㅅ][ㅅ][ㅈ][ㅈ])
- 개화기 이후, 서구어(특히 영어)의 도입에 따라, 특수 발음([f], [v], [th])의 표기를 위해 특별한 표지(권점)이 부가 되기도 했다.
- 일제 강점기를 거치면서 일본 문자를 섞어 쓰거나, 영어 같은 외국 문자가 문서에 노출되는 현상이 많아졌다.
우리 시대의 문자 환경
- 정보의 출처가 다양해지고, 정보의 교류가 활발해지면서 외래어, 외국어가 원문 표기 형태로 노출되는 일이 많다.
- 우리의 문서 환경에서 사용되는 문자들은 다음과 같다.
- 한글/옛한글/한자/구결
- 영문자, 라틴문자, 국제음성기호, 키릴 문자
- 일본문자(히라가나, 카타가나), 주음부호, 중국 간자(폰트로 제공)
- 히브리어 문자, 그리스 문자(신학자와 목사님들을 위한)
- 숫자, 수학식의 기호, 특수 기호, 약물, 불릿, 선문자, 도형문자, 기타
- 이러한 문자들의 일부는 이미 KSC 5601의 특수문자에 포함되어 있었다.
- 이러한 문자-문서 환경의 영향으로 토종 워드프로세서인 <아래한은>은 소비자들의 요구에 부응하여, 가장 많은 외국 문자를 지원하는 시스템으로 한때는 세계에서 제일이었다.
- 문제점1: 문자와 코드의 합치에 의한 투명성이 유지되기 힘들다.
- 예를 들어 가운뎃점(나열부)의 경우 4 가지 이상의 표현이 가능했다.
- 화면에서의 시각적인 정보보다는, 정보처리의 관점에서는 컴퓨터 내부의 부호값의 문제가 더 고려되어야 한다.
- 문제점2: 다종의 문자가 사용되면서 정보의 정확한 표현에는 도움이 되지만, 표기 방식의 다양함이 생겨 혼란을 초래할 수 있다.
과제1: 자판 개발
- 유니코드 문자 환경에서 편의로운 문자 입력법 개발
- 다국어 환경에서의 손쉬운 자판 변경이 용이해야 한다.
- 다국어 혼성 문서의 편의로운 작성을 전제로 해야 한다.
- 글자판의 변경의 지능화, 자동화를 고려해야 한다.
- 외국인들을 위한 한글 입력 방법을 적극 개발, 보급해야 한다.
- 적극적으로는 주요 외국 문자 입력 방식을 개발하여 제공한다.
- 중국에 간자체의 입력법을 개발 보급하고, 중국어 입력 체계에서 한글도 입력할 수 있는 프로그램을 개발, 보급한다.
- 영문 자판에서의 한글 입력 방법을 표준화하여 제공한다.
- 자판을 배우기 이전의 외국인이 한국에 관한 정보를 검색할 수 있도록
- 로마자 표기법에 근거하여 컴퓨터 환경에 맞는 합리적 방법을 연구.
- 한자 입력 방식의 지능화도 필요
- 한글-한자의 교체 입력을 손쉽게 하는 방안 연구.
- 한글 워드프로세서에서 일문자 입력 도중 한자를 손쉽게 입력할 수 있는 방안 연구
- 보다 합리적이고 효율적인 자판 개발 연구
- 인체공학적으로 편리하고, 한글공학적으로 완전한 자판의 개발
- 하지만 새로운 자판의 보급에는 많은 장애가 있다.
- 시장의 논리(많이 사용하고 있는 것이 표준)를 어떻게 극복할 것인지?
- 어떻게 익숙한 기존 자판을 버리게 하고 새로운 자판에 적응하게 할 것인지?
- 코드의 변화는 사용자들이 잘 알아차리지 못하나, 자판을 그렇지 않다.
과제2: 한글 코드
- 유니코드의 한글 코드 및 구현 방법은 아직도 완전한 것이 아니다.
- 주된 이유는 옛한글의 처리 문제다.
- 옛한글의 음절이 완전히 조사되어 있지 않은 상태다.
- 옛한글 음절자 지원을 중심으로 입력법이 개발되고 있기 때문이다.
- 한자의 문제도 있기는 하지만 논외로 한다.
- 필자의 생각으로는 옛한글의 초중종 자모를 현재의 상태에서 조합형으로 처리하기를 바란다.
- 현재는 음절자 형태로 확장 영역에 배열하고 있다.
- 이것은 Microsoft사의 내부 처리 방식에 근거한다.
- 학술적인 언어 자료에서는 현대한글 및 옛한글 모두를 조합형으로 처리
- 일반적인 언어 자료는 음절 완성자 사용도 무방
- 둘 사이의 컨버전 프로그램 개발 필요
- 언어 자료의 처리는 조합형 텍스트를 전제로 하자.
과제3: 한글 출력
- H/W, S/W 환경의 변화
- 일반적으로 PC의 모니터는 해상도가 높아지고, 화면의 크기가 커지는 현상이 있다.
- 휴대용 단말장치(휴대전화, PDA)의 화면 크기는 일정 범위를 넘어서지는 못한다.
- 프린터 장치의 해상도도 점점 높아지고 있다.
- 300dpi ? 600dpi ? 1200 dpi ? 2400 dpi
- 이러한 변화에 적용하는 한글 폰트 개발 필요
- 인터넷용 화면 폰트의 적극적인 개발 필요
- 유니코드 환경에 어울리는 한글 폰트 개발 필요
- 출력 장치에 적합한 폰트 개발 필요
- 가독성과 미려성이 고려된 폰트 개발 필요
문제1: 한글의 세계화
- 한글의 세계화와 관련된 문제들
- 한글을 발음부호로 쓰려는 일
- 한글을 개발한 민족의 문화적 자긍심을 높일 수 있다.
- 외국에 보급할 경우, 문화적 차이로 인하여 실현 가능성이 적다.
- 국내에서 훈민정음의 자모 모두, 여기에 새로운 부호를 도입하여 발음부호 체계로 사용할 경우, 자칫 일상의 문자 생활에 부정적 영향을 미칠 수 있다.
- 음절 글자의 가짓수가 많아진다.(몇 억 개까지 확장될 수 있다.)
- 소리글자의 특성상, 맞춤법 대신 소리나는대로 표기하는 경향이 커진다.
- 정보화의 장애가 될 수 있다.(오토마타가 어렵다.)
- 한글의 기호적 특성(장점)이 사라진다.
- 교육하기가 어려워진다.
- 문자를 가지고 있지 못한 민족에게 한글을 보급하는 일
- 문화적 차이 및 인접국과의 관계로 문제가 발생할 수 있다.
문제2: 부드러운 글쓰기
- 필사와 타자 시대의 글쓰기
- 필사의 시대에는 머릿 속의 영상(글씨)을 손을 도구로 종이에 직접 그렸다.
- 저속이지만, 부드러운 글쓰기(soft writing)가 실현된다.
- 타자의 시대에는 머릿 속의 영상(글씨)을 자판에서 지정된 방법으로 손가락을 사용하여 두드리어 표현한다.
- 고속의 딱딱한 글쓰기(hard writing)가 실현된다.
- 재활용과 사본 제작 및 정보의 활용이 아주 용이하다.
- 제약: 컴퓨터 화면의 크기에 종속되며, 창(window)을 통해서만 문서를 보게 된다.
- 제약: 타자에 의해 문자를 입력하므로, 타자의 매커니즘에 익숙해야 한다.
- 컴퓨터에서 지원하는 글자꼴로 문서를 작성하며, 지정된 방법으로 입력해야 한다.
- 컴퓨터 통신의 환경에서 새로운 글쓰기의 형태가 등장하였다.
- 선구자: 이상(김해경)의 일부 시작품은 필사와 타자의 중간적 입장에 서 있는 글쓰기
- 표기의 축약, 소리나는대로 쓰기, 연철 표기, 속어-은어의 난무, 이모티콘의 활용, '외계어' 표기
- 긍정적인 면
- 컴퓨터의 딱딱한 글쓰기를 부드러운 글쓰기로 전환하는 의미가 있다.
- 정서적 표현력을 높이며, 친근한 목소리를 가지게 된다.
- 부정적인 면
- 문자 생활의 혼란을 야기한다.
- 발화 환경과 소통의 통로를 제대로 이해하지 못할 경우, 소통의 단절이 빚어진다.
문제3: 새로운 문서 환경
- 한글이 우리의 경험 세계를 축적, 표현, 전달의 도구로 충분한지에 대한 의문 대두
- 유니코드 문자 환경에서, 사용할 수 있는 문자의 선택 영역이 확대되었다.
- 하나의 문서 내에서 다국어 혼성 문서를 표현할 수 있게 되었다.
- '외계어'는 유니코드 문자 환경이 초래한 문자 혼란의 시초라고 할 수 있다.
- 경험 세계 자체가 세계화의 과정에 있어서, 외국어와의 접촉이 굉장히 늘어났다.
- 컴퓨터 통신, 인터넷 등의 연재물들이 여과없이 종이책으로 출판되고 있다.
- 서점의 중요 서가를 차지하고 있으며, 판매량도 무시 못할 지경이다.
- 정보시대의 새로운 문서 환경에서의 문자살이에 대한 정책적 연구와 한글 운동 필요
- 정보기술의 발달로 새로운 문서의 개념이 자리잡고 있다.
- 기록의 매체인 종이와 기록 방식인 문자로 이루어진 것이라는 종래의 개념이 무색해졌다.
- 기록 이후 고정성을 가지는 종이 문서의 개념도 달라졌다.
- 인터넷의 보급과 더불어 하이퍼텍스트 문서가 주류로 자리잡게 된다.
- 하이퍼링크와 멀티미디어의 혼성 문서가 가능해졌다.
- 종래의 워드프로세서가 하이퍼텍스트 저작 도구라는 개념으로 확장되고 있다.
- 도서관에는 종이책이 아니라 전자도서와 전자문서가 서가를 채우게 된다.
- 전자문서는 구조적인 문서로서, 기계가 읽을 수 있도록 만든 것이다.
- 전자도서관으로 발전하고 있다.
- 새로운 문서 환경에서도 '한글'이 확고하게 자리잡을 수 있도록 연구해야 한다.
(c)김병선 kimbs@aks.ac.kr |
이 논문은 한국어정보학회 국제학술회의(2003.10.23, 상명대학교 국제회의실)에서 발표한 것입니다. |