|
|
[그림 1] 프로그램 실행과정
(2-1) [그림 1] 왼쪽 상단에 보이는 File을 클릭하고 Open을 클릭하여 분석하고자 하는 코퍼스들을 불러온다.
(2-2) 먼저 분석한 결과 값을 Save를 클릭하여 원하는 이름의 파일로 저장한다. 일반적으로 여타 프로그램에서는 결과 값은 분석 후에 저장하도록 되어 있지만 본 프로그램에서는 저장 후 분석을 진행한다는 점이 색다르다.
(2-3) 사용하는 단어군 목록이 basewrd1으로 통합되어 있는 관계로 하단의 Number of Baseword Files에는 1으로 입력하고 Basewrd1 On만 선택한다. Basewrd2 On과 Basewrd3 On에는 클릭하여 선택을 해제한다. 분석 어휘의 정렬 순서를 위해 Sort by Freq(빈도순) 또는 Sort by Range(사용범위순)를 선택한다.
(3) [그림 2]와 같이 결과분석 파일을 열고 LIST OF FAMILY GROUPS를 찾는다.
|
[그림 2] 결과분석
위의 자료를 복사해서 엑셀(EXCEL) 프로그램에 붙여 넣는다.
(3-1) [그림 3]과 같이 엑셀에 자료를 붙여 넣은 후 BASE ONE FAMILIES, RANGE, FAFREQ의 값만 남기고 나머지는 삭제한다.
|
[그림 3] 엑셀 데이터 입력
(3-2) 엑셀의 자료에서 정렬부분을 지정하고 데이터 정렬 기능에서 첫째기준과 둘째 기준에 사용범위(Range)든 빈도수(Frequency)든 사용목적이나 사용자의 선택에 따라 입력하고 내림차순으로 [그림 4]와 같이 재정렬을 시행한다.
|
[그림 4] 엑셀 데이터 정렬
(3-3) [그림 5]와 같이 선별 기준에 따라 표제어(대표형) 정렬이 끝나면 예외항목의 여부를 결정해야 한다. 고유명사나 감탄사는 예외항목으로 두는 것이 일반적이며 이를 위해서는 표제어에서는 삭제를 해야 한다. 알파벳, 숫자, 나라명, 단위명칭, 외래어 등은 예외항목으로 제외시킬 것인지, 단어군 목록에 포함시킬 것인지를 선택하고 예외항목으로 두고자 한다면 표제어 목록에서는 고유명사나 감탄사와 마찬가지로 삭제해야 한다. 그러한 선별과정이 끝나면 단어군 목록의 단위를 결정하여 그 단위만큼 표제어를 복사하여야 한다. 즉 수준별 단어목록을 제작한다고 할 때 한 수준이 올라갈 때 마다 추가되는 단어군의 양을 100단어, 250단어, 500단어, 1000단어 단위 등으로 결정해야 한다. 1000단어 단위로 결정을 하게 되면 수준별로 각 1000단어씩 증대되게 된다. [그림 5]는 20단어씩 증대되는 단어군 목록을 제작하는 예시로 첫 20단어의 표제어를 복사하여 단어군을 목록을 만들고 그 다음으로 그 다음 20단어를 복사하여 단어군 목록을 만들면 된다.
|
[그림 5] 단어군(family) 목록 제작을 위한 표제어(headword) 선택
(4) 단어군 목록을 만들기 위해서는 복사한 표제어를 메모장(텍스트 파일)에 붙여 저장하고 Familizer의 open을 클릭하여 저장한 파일을 불러오고 basewrd1 on만 선택, Number of Baseword Files를 1로 수정, Update basewords, Zero basewords를 클릭한다. 그 다음 Save한 후 Process Files를 클릭하면 Range 값이 저장된다. 실제로는 분석 값은 불필요한 것이지만 절차 상 필요한 과정이다.
(5) Familizer를 통해 분석을 마치고나면 [그림 6]과 같이 상단의 File를 클릭하여 Move/Copy Basewords를 선택하고 greater than 0를 클릭, Copy words, Append to file을 클릭, basewrd4를 본인이 원하는 이름으로 입력, 단 basewrd1을 제외한 다른 이름 또는 그대로 basewrd4로 써도 상관없다.
|
[그림 6] 선택 단어군(family) 복사
(6) Move/Copy Basewords 기능을 통해 [그림 6]에서 OK를 클릭하면 지정한 이름, 즉 basewrd4의 이름으로 다음과 같은 단어군 목록(family list)이 생성된다. 단, Nation의 14,000단어 내에 포함된 단어군만 생성된다. basewrd4를 basewrd1로 바꿔 따로 저장하고 [그림 5]에서 분석한 그 다음의 단어를 선택하여 똑같은 절차로 단어군을 생성하여 basewrd2로 저장하고 계속 원하는 만큼 반복하면 사용자만의 수준별 단어군 목록이 작성된다. RANGE 프로그램 폴더에 기존의 basewrd를 삭제하고 제작한 단어군 목록을 붙여 넣으면 새로운 RANGE 프로그램의 제작이 끝난다.
|
[그림 7] 단어군(family) 목록 생성
(7) 고유명사와 같은 예외항목이 있을 경우 basewrd를 하나 더 만들고 그 안에 [표 1]과 같이 추가 항목을 입력해 주면 된다.
[표 1] 추가단어 입력의 예
kimchi 0 gimchi 0 america 0 american 0 americans 0 minsu 0 minhee 0 |
굴절 및 파생 접사의 분류표(Bauer와 Nation, 1993; Nation, 2001)
단 계 |
내 용 |
1단계 |
형태가 다르면 기본형이 같더라도 낱말들의 형태가 다르면 모두 다른 낱말로 간주하는 단계이다; book과 books가 같은 뜻을 갖을 것을 구별하지 못하는 단계 |
2단계 |
모든 굴절형을 기본형과 함께 묶어서 동일한 낱말로 간주한다. 여기에 해당하는 굴절형은 복수형, 3인칭 단수 현재형, 과거형, 과거분사형, -ing형, 비교급, 최상급과 소유격이 있다. |
3단계 |
빈도가 높으며, 생산적이고, 규칙적인 접사 -able, -er, -ish, -less, -ly, -ness, -th, -y, un-, non-이있다. |
4단계 |
빈도가 높고, 생산적인 편이며, 종종 어근에 변화를 주는 접사 -al, -ation, -ess, -ful, -ism, -ist, -ity, -ize, -ment, -ous, in-의 11개 접사를 포함한다. |
5단계 |
빈도가 낮고, 생산적이지 않으며 어근에 변화가 적은 접사 -age (leakage), -al (arrival), -ally (idiotically), -an (American), -ance (clearance), -ant (consultant), -ary (revolutionary), -atory (confirm!atory), -dom (kingdom; officialdom), -eer (black marketeer), -en (wooden), -en (widen), -ence (emergence), -ent (absorbent), -ery (bakery; trickery), -ese (Japanese; officialese), -esque (picturesque), -ette (usherette; roomette), -hood (childhood), -i (Israeli), -ian (phonetician; Johnsonian), -ite (Paisleyite; also chemical meaning), -let (coverlet), -ling (duckling), -ly (leisurely), -most (topmost), -ory (contradictory), -ship (studentship), -ward (homeward), -ways (crossways), -wise (endwise; discussion-wise), anti- (anti-inflation), ante- (anteroom), arch- (archbishop), bi- (biplane), circum- (circumnavigate), counter- (counter-attack), en- (encage; enslave), ex- (ex-president), fore- (forename), hyper- (hyperactive), inter- (inter-African, interweave), mid- (mid-week), mis- (misfit), neo- (neo-colonialism), post- (post-date), pro- (pro-British), semi- (semi-automatic), sub- (subclassify; subterranean), un- (untie; unburden의 50개 접사를 포함한다. |
6단계 |
빈도는 높으나 철자법이 규칙적이지 않은 접사 -able, -ee, -ic, -ify, -ion, -ist, -ition, -ive, -th, -y, pre-, re-의 12개 접사를 포함한다. |
7단계 |
고전어 어근 및 접사(classical roots and affixes) -ar(circular), -ate(compassionate, captivate, electorate), -et (packet, casket), -some (troublesome), -ure (departure, exposure), ab-, ad-, com-, de-, dis-, ex-('out'), in-('in'), ob-, per-, pro-('in front of'), trans- |
|