|
언어 문서화는 다양한 사회 문화 환경에서 사용되는 언어에 대해 오디오, 비디오, 사진, 텍스트 문서 등을 수집하고 생산하는 것을 목표로 삼는다. 수집하고, 기록하고, 분석하고, 자료화하는 작업은 다음과 같은 기본 원칙 하에 이루어진다. | |||||||||||
1. 다양한 언어 현상을 기술할 수 있을 정도의
고급 수준의 언어 자료를 창조해야 한다. 2. 다른 모든 자료가 없어진다고 해도 그 언어에 대한 지식을 회복할 수 있도록 해야 한다. 3. 언어의 유지와 학습을 지원할 수 있는 자원을 만들어야 한다. | |||||||||||
언어 문서화 작업의 결과는 전형적으로 다양한 매체의 자료를 생산한다. | |||||||||||
1. 오디오 2. 비디오 3. 사진 4. 문서 (예: 전사, 언어 기술, 분석 텍스트) 5. 메타자료 (원자료에 대한 구조화된 자료) | |||||||||||
언어 문서화를 위해서는 데이터의 포맷을 선택해야 하는데, 데이터 포맷의 선택은 매우 어려운 문제이다. 기술과 규약이 변함에 따라서 데이터 포맷도 변할 수 있기 때문에 적어도 다음 사항은 구별하여 결정하여야 한다. | |||||||||||
|