아이폰 시리에 적용된 기술은 크게 2가지로 구분된다.
첫째, 음성인식, 음성합성 기술이다. 이 기술은 음성인식 연구자들이 지난 수십년 동안의 연구-개발 결과물이다.
그동안 ARS 전화 응답 등 제한적으로 활용되어 왔던 음성 인식, 합성 기술이 스마트폰에 적용된 것이다.
시리에 적용된 음성인식 기술은 스탠포드 대학의 SRI 인터내셔널에서 주도하여 아이폰 앱으로 상용화한 것이다.
둘째, 자연언어 질의-응답 시스템(question-answering system)이다. 텍스트로 질의하고 텍스트로 답을 찾아주는
질의-응답 시스템 또한 NLP 분야에서 수십년 동안 연구되어 왔다.
1960년대에 MIT에서 개발한 Eliza와 SHRDLU가 그 시초라 할 수 있고, MIT의 SMART 시스템(정보검색 시스템),
ask.com의 Ask Jeeves로 발전되어 왔다.
시리는 사용된 질의응답 시스템은 Wolfram Alpha(http://www.wolframalpha.com/)라고 알려져 있다.
정리하면... 시리는 아래와 같은 과정을 거쳐 작동을 한다.
1) 음성 인식
2) 인식된 텍스트 질의어를 Wolfram Alpha로 전송
3) Wolfram Alpha가 찾아준 답변(answer)를 보여줌
4) 답변을 음성 합성 기술에 의해 스피커로 들려줌.
시리는 지난 수십년 동안 수많은 연구자들이 땀흘려 연구해 왔던 음성인식 기술과 NLP 기술이 결합되어
이제야 비로소 빛을 보게 된 것이다. 시리 덕분에 지난 수십년 동안 잠깐 주목을 받으려 했다가
외면 당하곤 했던 nlp, 음성 분야가 찬밥 신세를 면하고 그 가치를 인정받는 계기가 되기를 바란다.
첫댓글 간략하게 정리해주셔서 감사합니다.