|
저는 아날로그를 말합니다. 디지털을 듣습니다 (archive.org)
11 Apr 2008 - 8 Oct 2015
나는 아날로그를 말하고, 너는 디지털을 듣는다
존 히긴스
이 논문의 버전은 1989년 Guelph에서 열린 Canadian CALL 컨퍼런스의 본회의에서 처음 발표되었습니다. 그 당시에는 컴퓨터 사운드 카드와 음성 인식 소프트웨어가 있었지만 현재의 표준으로는 비싸고 상당히 원시적이었습니다.
화자는 성도의 유연한 구멍에 의해 조절되는 호흡 펄스를 사용하여 주기적인 기압 변화를 생성합니다. 이것들은 듣는 사람을 만날 수 있는 곳까지 파동으로 퍼져 나가 고막의 미세하지만 무한히 변하는 왜곡을 일으킵니다. 작가는 펜을 움직이거나 열쇠를 두드려 흰색 표면이 불규칙하게 어두워지는 것을 만든 다음 망막에 이미지를 형성하기에 충분한 빛을 통해 독자 앞에 놓을 수 있습니다. 이는 본질적으로 아날로그 프로세스입니다.
그러나 언어는 아날로그적 사실에 디지털 체계를 부과한다. 소음은 음소에, 모양은 문자소에, 이들의 순서는 단어와 문장에 명확하게 할당됩니다. 수신자의 상당한 처리 입력에 의해 도움으로 문장은 의미 또는 메시지가 됩니다. 물론 수신되는 데이터가 모순되거나 불확실할 수도 있습니다. 신호가 손상되어 시스템이 수리 모드로 전환되어야 합니다: "죄송합니다, 그게 뭐였나요?" 또는
"언니의 손글을 읽을 수 없습니다."
이 논문의 제목은 언어학자들이 오랫동안 알고 있던 자명한 말이지만, 그들이 그 단어로 표현하지는 않았을 수도 있습니다. 결국, 그것은 음운론 전체의 기초입니다. 양고기와 같은 단어에서 명확한 l, 어두운 l 또는 그 사이의 어떤 것을 사용하는지 여부는 중요하지 않습니다. 나는 영어로 말하고 있고 당신은 영어로 듣고 있기 때문에 내가 만드는 소음을 / l / 음소에 할당합니다. 내가 ram이라고 말하면 그 단어의 첫 번째 소음을 / r / 음소에 할당합니다. 그러나 일본어로 듣고 있다면 더 어려울 수 있습니다. 청취는 디지털이지만 언어마다 기본이 다릅니다.
einer anderen Sprache zu sprechen anfaengt, und auch genau wo에서 첫 번째 언어를 다시 말하기 시작하는 정확한 순간을 발견하는 것이 얼마나 쉬운지 생각해 보십시오. 재미있게도, 이것은 쌍의 언어 중 하나가 완전히 익숙하지 않을 때 훨씬 더 쉬워집니다. 만약 제가 영어로 시작한다면, lewkoo gamlang phuud pasaa thai, khun mai khawchai leui theung wela, 저는 다시 영어로 말하기 시작합니다. 중간에 무슨 일이 일어나고 있는지 모른 채도 크로스오버 지점을 식별하는 것이 매우 쉽다는 것을 알았을 것입니다. 점진적인 혼합은 없습니다. 나는 영어로 말하고 있거나 영어를 말하지 않습니다.
디지털 말하기 테스트아날로그/디지털 구분에 더 주목할 수 있는 한 가지 영역은 발음 테스트입니다. 면접부터 가장 기본적인 소리 내어 읽기나 반복 활동에 이르기까지 대부분의 기술에는 후보자가 소리를 내는 아날로그 과정을 거치고 성과가 어떤 기준에 얼마나 가까운지에 대해 아날로그적 판단을 내리는 평가자가 포함됩니다.
"네, 그것은 확실히 /i:/가 아니라 /ɪ/였습니다."; | |
또는 | "귀하의 /y/는 충분히 반올림되지 않았습니다." |
이것은 의사 소통의 결정 과정과는 완전히 다르며, 의사 소통이 이루어지지 않기 때문에 놀라운 일이 아닙니다. 문제는 듣는 사람이 화자가 말하려는 것을 미리 알고 있다는 것입니다.
이때 매우 간단한 컴퓨터 프로그램이 도움이 될 수 있습니다. 컴퓨터는 학습자에게 예를 들어 문장을 소리 내어 읽거나 질문에 답하도록 과제를 설정할 수 있지만, 평가자는 여러 가지 가능한 과제 중 어떤 것이 설정되었는지 알려주지 않습니다. 따라서 평가자의 마음 속에 있는 질문은 "배라는 단어를 말하려는 좋은 시도였는가?"가 아니라 "후보자가 배나 양이라는 단어를 말하려고 했는가?"입니다."
단일 음소 대비를 테스트하기 위해 컴퓨터는 다음과 같이 후보자에 대한 작업 시트를 인쇄합니다.
이 문장을 소리 내어 읽으십시오.
요즘에는 고래를 거의 볼 수 없습니다.
조종사들은 많은 난파선에 대한 책임이 있습니다.
가열해야 합니다.
조심하세요! 그 발뒤꿈치는 위험합니다.
그가 밥을 주었을 때 나는 놀랐다.
쥐는 번식하기 위해 더 많은 공간이 필요했습니다.(바바브)
각각은 무작위로 생성되며 실제 문장은 후보자마다 다릅니다. 한편 평가자는 수표를 받습니다 시트는 다음과 같습니다.
One hardly ever sees any (A) veils nowadays. (B) whales The (A) pilots were responsible for many... (B) pirates You've got to (A) eat it. (B) heat Be careful! That (A) heel's dangerous. (B) hill's I was surprised when he gave me the (A) rice. (B) lice. The rats need more room to (A) breathe. (B) breed.
평가자는 문장을 듣고 각각에 대해 A 또는 B를 확인한 다음 목록을 후보자의 시트 하단에 인쇄된 내용과 비교합니다. 실제로 우리가 여기서 하는 일은 후보자가 평가자에게 듣기 테스트를 하도록 하는 것입니다. 우리는 평가자가 "후보자가 그 소리를 얼마나 잘 낼 수 있는가?"라는 질문을 아날로그 방식으로 다루는 판사처럼 행동하기보다는 "후보자가 나에게 무엇을 말하려고 하는가?"라는 질문을 디지털 방식으로 다루는 청취자처럼 행동하도록 하고 있습니다.
여전히 문제가 있습니다. 과제의 난이도가 반드시 같을 필요는 없으며, 품종이라는 단어를 얻은 대부분의 후보자는 숨을 쉬는 사람들보다 자신을 "운이 좋다"고 생각할 수 있습니다.이것은 특정 대비가 여러 번 나타나도록 조정해야 할 수 있으며, 더 어려운 옵션이 더 자주 발생하지만 단어를 예측할 수 있을 정도로 빈번하지는 않습니다. 시험이 다양한 언어 배경에 맞게 준비되는 경우, 숫자 특정 학습자에게 어려움을 주지 않는 항목의 비율. 결국 기록이 쌓이면 시험을 특정 언어에 민감하게 만들 수 있으므로 예를 들어 일본어 학습자를 위한 시험지에는 r/l 대비가 더 많이 포함되고 s/z 대비는 포함되지 않을 수 있습니다.
초분절(Supra-segmentals)
분절 음소 이외의 기능에 대해 어느 정도 동일한 기술을 사용할 수 있습니다.
예를 들어:
(이 문장을 (A) Miss Jenkins / (B) 다른 사람과 이야기하는 것처럼 읽으십시오)
제 동료인 젠킨스 양입니다.
(이 문장을 (A) "그는 똑똑한 학생이었나요?" 또는 (B) "그는 오히려 나쁜 학생이 아니었나요?"라는 질문에 대한 답으로 말합니다.)
그는 매우 영리한 학생이었습니다.
광범위한 강세와 억양 기능을 포괄하는 항목을 고안하려면 약간의 독창성이 필요하며 다음과 같습니다 작업을 설명하는 데 사용되는 메타 언어에 문제가 있습니다. 그러나 학생들이 적절하게 준비했다면 이러한 종류의 일부 항목을 포함하는 것이 여전히 가치가 있을 수 있습니다. 당분간 우리는 이 기술이 신뢰할 수 있고 경제적인지 확인하기 위해 시험을 수행할 기회를 기다리고 있습니다.
인식언어는 그 갑작스러움을 강조하는 인식 과정에 대한 은유로 가득 차 있다: 동전이 떨어졌고, 딸깍 소리가 났고, 그것이 제자리에 떨어졌다. 인식과 이해는 점진적인 과정이 아니라 비약적인 발전으로 일어난다. 양자 도약은 종종 매우 크고 중요한 것을 제안하는 데 사용되지만, 실제로는 물리학자들에게 매우 미세한 것임을 잊지 마십시오. 상대적으로 작은 에너지 방출 과정에서, 셀 수 없이 많은 수백만 번의 양자 도약이 일어날 수 있다. 같은 방식으로, 짧은 언어에서도 발생하는 은유적 양자 도약은 열거를 거부합니다. 이러한 비약적인 발전의 미미함은 언어가 어떻게 이해되고 학습되는지를 고려할 때 관련이 있습니다. 배움이 가르침을 받는 것이라면, 언어는 사실상 배울 수 없는 것처럼 보인다. 긴 발화를 이해하는 과정에서 청자가 수행하는 분리된 차별 및 종합 행위를 모두 열거하려고 하면 목록은 어떤 강의 계획서보다 빠르게 길어집니다. 음소 전사는 이미 말의 흐름에 존재하고 중요한 것을 크게 단순화한 것입니다. 그럼에도 불구하고 우리는 언어를 배웁니다. 그것은 각 항목에 대한 별도의 의식적인 학습 행위에 의해 이루어질 수 없습니다.
아날로그/디지털의 역설여기에는 컴퓨터 자체에 관한 기묘한 역설이 있다. 컴퓨터는 디지털 기기이지만, 언어를 말하거나 제시하는 아날로그 과정을 음성 인식의 디지털 과정보다 훨씬 더 잘 처리합니다. 음성과 관련된 모든 작업을 수행하기 위해 그들은 마이크에 의해 포착된 소리의 파형을 취하고, 정수로 표현할 수 있는 모양에 가장 가까운 근사치를 찾고, 이 숫자를 사운드 스펙트럼의 다양한 부분에 존재하는 에너지의 값으로 분석한 다음 이 값을 사용하여 교반하는 아날로그-디지털 변환기를 사용합니다 확성기의 원뿔. 사실 컴퓨터는 소리의 디지털 분석을 꽤 잘하는데, 나는 쇼팽이나 수사의 CD 녹음을 재생할 때마다 그 사실을 잘 알고 있다. 그들은 파형을 음소에 일치시키는 데 찌를 수 있지만, 알려진 화자의 느리고 신중한 음성으로 95%의 정확도를 달성하는 다소 조잡한 방법으로만 가능합니다. 그들은 일치시키는 과정을 일반화하는 것, 나와 내 아내의 말에서 [f] 소리의 파형에 공통적인 것을 추상화하는 데 그다지 능숙하지 않은 것 같습니다. 그들은 소리를 메시지와 일치시키는 것, 말의 의미를 결정하는 데 훨씬 더 나쁩니다. 그들은 유행을 좇아 그것을 하지만, 잠정적이고 힘들게 한다. 인간은 적은 노력으로 즉각적으로 그것을 하는 것 같습니다.
디지타이저의 간단한 사용소음에서 의미를 찾아내는 무의식적인(인간의 경우) 과정에 대한 연구는 제가 수년 동안 관심을 가져온 분야이며, 디지털화 소프트웨어의 보람 있는 응용 프로그램입니다. 간단한 사운드 카드의 편집 기능조차도 입문 음성학 수업을 변형시킬 수 있습니다. 눈이라는 단어를 녹음하고, 반전시키고, 다시 재생함으로써, 당신은 그것을 귀라는 단어 (영국식 발음으로)와 같은 것으로 바꾸고, 따라서 모음 요소가 / aɪ/ 이중음임을 보여줍니다. 나는 루프 테이프 레코더로이 트릭을했다. 저를 믿으십시오, 음성 카드를 사용하면 더 쉬워집니다. ham과 같은 단어를 녹음하면 오실로스코프 트레이스를 표시하여 구성 요소 사운드 사이에 침묵이 없음을 명확하게 보여줄 수 있습니다. 말의 흐름은 실제로 흐름입니다. ham, his 및 who의 /h/ 요소를 인쇄하여 다음 모음이 소리를 채색하는 방식을 보여줄 수 있습니다. 모음의 단순화 된 스펙트로 그램을 얻을 수 있으며, /i/의 높은 두 번째 포먼트와 피치 중앙에서 거대한 에너지 폭발을 보여줍니다 첫 번째 포먼트와 두 번째 포먼트가 일치하는 /a/의 범위입니다. 이와 같은 시연은 음성학에 생명을 불어넣습니다.
스피치 게이팅대학원생인 앤 그레이엄(Anne Graham)은 작은 연구 신청을 맡았는데, 그는 일상에서 내뱉는 여러 가지 말을 녹음했다 예를 들어:
휴게실에서 커피 한 잔 하러 오시는 건 어떨까요?
도서관에는 수천 권의 책이 있지만 그중 정말 읽고 싶은 책은 한 권도 없습니다.
각 문장에서 그저 한 음절 정도의 의미 없는 단편을 골라내고, 그 문장을 30초 단위로 양방향으로 네 번이나 확장했다. 여섯 번째 단계에서 피험자들은 전체 문장을 들었다.
fra
ingfra omingfracu
comingfracupof
boutcomingfracupofcoff
어때요?
피험자들은 그들이 들은 각 단편을 표현할 수 있는 어떤 방식으로든 기록하도록 요청받았다. 목표는 어느 시점에서 그들이 무의미한 음절을 쓰는 것을 멈추고 의미가 있는 단어를 쓰기 시작하는지 보는 것이었습니다. 20 명의 자원 봉사자가 있었는데 그 중 10 명은 원어민이었고 10 명은 영어 중급 이상의 영어 수준을 가진 해외 학생들이었습니다. 그들은 두 개의 하위 그룹으로 나뉘었는데, 한 그룹은 잘 정립된 맥락에서 문장을 듣고, 다른 그룹은 "차갑다"는 문장을 들었습니다. 모든 실험은 개별적으로 수행되었으며, 피험자들은 각 단편을 원하는 만큼 반복하도록 요청할 수 있었다.
이 작은 실험에서 몇 가지 다소 예상치 못한 발견이 나왔다: 그 중 하나는 원어민들이 예측한 대로 동전이 거의 떨어졌지만, 그들 중 대부분은 세 번째 또는 네 번째 단편으로 전체 문장을 예측할 수 있었지만, 대부분의 외국인 학습자들은 발화를 이해하지 못했고 그것들을 매우 왜곡된 전사를 만들어냈다는 것이다. 또 다른 흥미로운 점은 문맥에 대한 지식이 원어민과 비원어민 모두에게 측정 가능한 차이를 만들지 않는 것처럼 보인다는 것입니다. 우리는 여전히 그 발견의 의미를 알아내기 위해 노력하고 있습니다.
숨겨진 단어현재 제가 관심을 갖고 있는 또 다른 프로젝트는 경청에 관한 것입니다. Cambridge Local Examinations Syndicate는 응시자가 문장을 듣고 문장에서 실제로 발생한 네 단어 중 어느 것을 결정해야 하는 듣기 테스트의 한 형태를 사용하곤 했습니다. 예를 들어, 그들은 들을 수 있습니다..
내가 너라면 그렇게 하지 않을 거야.
그리고 본다
오직 4번째 단어만이 발생했지만, 모든 방해 요인은 의미 있는 단위는 아니었지만 구어체 문장에서 발생한 일련의 소리였다. 만약 그 문장이 무의미한 소리의 흐릿함이었다면, 그들은 네 단어를 모두 "들었다"고 할 수 있으며, 그들이 마음속에 완전한 문장을 "기록"하는 데 성공했을 때에만 그들은 산만함 속에서 진짜 단어를 확실하게 찾아낼 수 있었다.
어떤 이유에서인지 이 테스트 기법은 인기가 떨어지는 것 같았고, 1969년 이래로 내 지식에 사용되지 않았습니다. 1 종종 그 이유를 궁금해했다. 나는 그 기술이 체면 타당성이 낮았고, 후보자들이 일종의 함정을 의심하고 테스트 형식에 분개했기 때문이라고 생각합니다. 이것은 내가 터키의 입학 시험에서 비슷한 유형의 시험을 사용했을 때 어느 정도 일어났습니다. 테스트 자체는 통계에 관한 한 훌륭하게 수행되었지만 인기가 없었습니다. 그러나 나는 여전히 이 활동이 듣기 기술에 대한 신뢰할 수 있는 지표를 제공하고 학습자가 듣기를 훈련하는 데 도움이 될 수 있다고 생각합니다. 이것이 단지 직감에 불과한 한, 그것은 검토가 필요하며, 나는 이런 종류의 활동을 하는 여러 학생들이 있습니다.
60년대에 사용된 이 테스트의 공개 형식은 모두 문맥에서 벗어난 고립된 문장을 제시했습니다. 내가 조사하고 싶은 한 가지는 일관된 텍스트를 형성하는 문장으로 수행되는 테스트가 어떻게 영향을 받는지입니다. 1989년 브리스톨의 한 학생이 오만 학생들을 대상으로 현지 교과서에서 발췌한 텍스트를 사용하여 프로젝트를 수행했습니다. 여기의 예비 결과는 내용에 대한 친숙함(텍스트에 대한 최근의 면밀한 연구에 미치지 못함)이 성능에 거의 영향을 미치지 않을 수 있음을 시사합니다. 쿠웨이트의 에이만 마라피(Eiman Marafi)가 스털링(Stirling)에서 실시한 후속 연구에서는 특정 유형의 기능 단어를 들어야 하는 학습 효과가 조사되었습니다. 예를 들어, 핵심 단어가 있을 수 있다는 기대가 학습자가 약한 형태를 듣는 방식에 영향을 미칠 수 있습니까? 이 링크를 따라 이 기술의 웹 기반 예를 확인하십시오.
테스트 및 학습내가 지금까지 설명한 모든 것은 시험과 관련이 있으며, 시험의 교도권적 측면, 즉 교사가 교사를 위해 수행하는 것을 암시할 수 있다. 그러나 장기적으로는 컴퓨터가 테스트 과정을 매우 쉽게 만들어서 학습자가 자신의 수행 기준에 대해 호기심을 가지고 찾는 자체 액세스 리소스가 되는 것을 볼 수 있기를 바랍니다. 자기 인식이 높을수록 성능 향상으로 이어질 가능성이 높다는 합리적인 예측을 할 수 있습니다. 나는 컴퓨터가 학생들에게 무엇을 해야 하는지 알려주는 조언자로서 기능하는 것이 아니라, 사실을 보고하는 것 외에는 아무 것도 하지 않는 완전히 중립적인 도구로서 기능한다고 본다. 학습자가 자신에 대한 사실을 발견하기 위해 기계를 사용한다면, 다음에 무엇을 할 것인지를 결정하는 것은 기계가 아니라 학습자에게 달려 있다. 제가 보고 싶은 것은 학습자가 테스트 결과의 수동적 수신자가 아닌 테스트 데이터의 중요한 소비자가 되는 세상입니다.
한편 내 작업의 맥락에서 컴퓨터는 이미 발음과 음성학의 전체 영역을 보다 실험적인 주제로 바꾸고 있으며, 학생들이 소리를 듣는 것뿐만 아니라 볼 수 있도록 하고, 예를 들어 철자법에서 이중 문자가 이중 조음이 아니라는 것을 발견하는 간단한 수준에서도 소리와 철자에 대한 일부 선입견을 제거할 수 있도록 합니다. 이것은 노예 역할의 컴퓨터가 언어 학습자에게 제공할 수 있는 일반적인 서비스, 즉 학습자(교사뿐만 아니라)가 실험할 수 있는 기회의 일부입니다. 슬로건으로 표현하자면, 그것은 재판을 다시 시행착오로 되돌려 놓는다.
1996년 9월 17일에 HTML 문서로 출판된 John Higgins가 준비한 페이지, 2010년 1월 개정.