많고 많은 AI기업. 다들 기술적으로 뛰어난 성과를 갖고 있다고 하는데요. AI 기술 기업 ‘스켈터랩스(Skelter Labs)’와도 이야기를 나눠봤습니다. 특히 대화형 AI 서비스를 제공하는 기업이 가진 기술과, 성과 지표 등을 어떻게 봐야 하는지 조금은 알 수 있었습니다.
📚 당신에게 들려줄 이야기
- 왜 대화형 AI일까, 커지는 AICC 시장
- 챗봇이 나를 화나게 하는 이유
- 스켈터랩스의 기술, 그 조합으로 나올 수 있는 서비스
- 기계독해 성능 평가 결과 ‘코쿼드’를 이해하는 방법
- 범용AI의 한계, 스켈터랩스가 하려는 것
- 스켈터랩스가 만들려는 휴먼AI
- AI 제품은 왜 만들기 어려울까
- AI 성능을 고도화하는 데 중요한 것
AI(인공지능) 관련 기업, 참 많은데요. ‘스켈터랩스(Skelter Labs)’는 다른 회사의 ‘대화형 AI’를 만들어주는 회사입니다. (참고로 AI 챗봇 ‘이루다’를 만든 ‘스캐터랩’과 다른 회사입니다.)
대화형 AI는 기계가 인간과 대화할 수 있게 만드는 기술인데요. 해당 기술이 적용된 대표적인 서비스로 채팅 로봇인 ‘챗봇(Chatbot)’을 들 수 있습니다.
스켈터랩스 김도연 CPO(제품·서비스 총괄), 서종훈 Head of Engineering(기술·연구 총괄)을 만났는데요. 대화형 AI 기술의 경쟁력, 관련 시장에 대해 듣고 왔습니다.
▶ 스켈터랩스가 ‘대화형 AI’에 집중한 이유
먼저 스켈터랩스는 왜 대화형 AI에 집중했을까요? 2015년 설립된 스켈터랩스는 작년까지만 해도 대화형 AI 외 비전 AI 등 다양한 AI 관련 기술들을 연구해왔습니다. 하지만 아무리 좋은 기술이 있다 해도 제품화가 되지 않으면 의미가 없을 수 있다고 판단했고, 대화형 AI를 제품화하기로 한 건데요.
스켈터랩스의 대화형 AI 기술을 적용한 서비스는 ①고객이 직접 구축하는 대화형 AI 플랫폼 ‘AIQ.TALK’ ②스켈터랩스가 직접 대화형 AI 솔루션을 구축해주는 ‘AICC(인공지능컨택센터)’ ③디지털 휴먼인 ‘휴먼AI’ 등입니다.
즉 다양한 기업이 스켈터랩스의 기술을 기반으로 한 챗봇이나 콜봇 등을 만들 수 있게 한 건데요. 정리하면 스켈터랩스의 대화형 AI 기술이 있고, 이를 소프트웨어 형태로 내놓은 것이 AIQ.TALK, 이 안에 있는 기술을 적용해 또 서비스하는 분야가 AICC와 휴먼AI인 겁니다.
특히 스켈터랩스는 AICC 시장이 커질 것으로 보고 있는데요. 현재 대화형 AI 시장에서 가장 비중이 큰 시장이고(업계에 따르면 60~70%가 AICC), 실제 많이들 진출해 있는 시장이죠.
기업의 니즈가 높은 건 실제 돈을 쓴 만큼 현재 효용을 보고 있기 때문인데요. 상담 등을 제공하는 고객 서비스센터에 많이 쓰이죠. 관련 인력에 들어가는 비용을 줄일 수 있습니다. 하지만 단순 비용 절감 말고 부가가치를 제공할 수 있는 것들도 꽤 있다고 하는데요.
STT(음성인식기술)를 이용해 상담사들에게 부가적인 정보를 제공해 상담하는 과정에서 좀 더 빠르게 대응이 되도록 한다든가, 텍스트에서 문제가 되는 것들을 필터링하고 제공해준다든가 하는 식으로 서비스적인 부가가치를 높이고 있습니다. (서종훈)
▶ 내가 만난 ‘챗봇’은 왜 답답할까
그런데 기업이 챗봇을 많이 활용한다고 해서, 그 챗봇을 쓰게 되는 고객이 다 만족하는 건 아닐텐데요. 개인적으로 전 챗봇이 답답합니다. 저 같은 고객이 느끼는 답답함은 어디서 비롯되는 걸까요? 챗봇의 성능은 어떻게 판단할 수 있을까요?
사실 기업의 니즈가 높긴 하지만, 대화형 AI 자체의 기술적 과제는 아직 많다고 합니다.
성능 지표도 딱 명확하게 볼 수 있는 분야는 아니라고 하는데요. 이는 ‘데이터셋(자료의 집합체)’과 관련 있습니다.
쉽게 말해 AI 성능을 비교해 순위를 매기기 위해선 알고리즘도 중요하지만, 그 전에 AI가 학습하는 데이터셋이 모두 같아야 합니다. 공정하게 같은 시험 문제(데이터셋)를 가지고 풀어야 하는 거죠. 그러려면 기준이 될 벤치마크 데이터셋이 있어야 하는데요.
▶ 스켈터랩스의 기술 경쟁력?
그렇다면 스켈터랩스는 왜 자사의 대화형 AI 기술력이 뛰어나다고 하는 걸까요?
일단 스켈터랩스의 대화형 AI 하위 기술은 ①자연어 이해(NLU) ②음성인식(STT) ③음성합성(TTS) ④기계독해(MRC), ⑤자연어 생성(NLG) 등으로 나뉩니다. 그리고 일반적으로 이 모든 기술 부문에서 높은 성과를 내는 게 쉽지 않은데, 스켈터랩스는 모두 최고의 기술적 성과를 가지고 있다고 자부하죠.
기술 수준과 관련해 대외적으로 보여줄 만한 순위가 있긴 한데요. ‘기계독해’ 분야에서요. ‘코쿼드(KorQuAD)’ 성능 평가 결과입니다. 코쿼드는 ‘LG CNS’가 만든 자연어 이해 학습용 한국어 표준데이터셋입니다.
스켈터랩스는 2020년 코쿼드 1.0 성능 평가에서 F1 스코어(코쿼드 순위 지표인 정답률 측정 점수) 95.15점으로 1위, 같은 해 또 코쿼드 2.0 성능 평가에서 F1 스코어 88.09점을 받으면서 1위를 기록했는데요. 하지만 현재는 모두 순위가 떨어진 상태긴 합니다. 코쿼드 순위, 어떻게 봐야 할까요?
그런데 더 살펴보니, 여전히 스켈터랩스가 1위를 유지하고 있는 부문도 있었는데요. 지연속도(1-example Latency)를 가지고 순위를 매긴 겁니다.
물론 그 외 기술들도 다른 회사와 겨뤄볼 기회가 있긴 한데요. 벤치마크테스트(BMT)라고 해서 같은 데이터셋을 가지고 하는 겁니다. 그때의 결과들을 가지고 고객사로부터 수주를 하기도 합니다. STT 같은 경우 특히 그렇다고 하네요.
▶ ‘범용AI’와 다른 길을 간다?
스켈터랩스가 차별점으로 내세우는 것이 또 있는데요. 범용AI가 아니라는 것입니다. 일반적으로 모델이 크면 클수록 정확하지만 느려진다고 하는데요. 이러한 무거운 모델이 목표로 하는 건 대개 범용AI입니다.
초거대AI가 해당하는데요. 어떤 질문이 들어와도 적당하게 대답할 수 있는 성능 좋은 범용 서비스를 만드는 겁니다. 그만큼 많은 데이터를 쏟아부어야 하고요. 인력과 비용이 많이 듭니다. 큰 회사들이 할 수 있겠죠.
범용AI에게 한계점으로 지적되는 게 있는데요. ①수정하기 힘들다는 점, ②특정 영역의 비즈니스에 바로 붙여 활용되기 쉽지 않다는 점 등입니다.
좋은 예가 있는데요. 요즘 이슈가 되고 있는 AI 챗봇 ‘챗 GPT(ChatGPT)’입니다. ‘오픈AI(OpenAI)’에서 만든 건데요. 오픈AI는 일론 머스크 테슬라 CEO(최고경영자) 등 실리콘밸리 기업가들이 AI 기술을 무료로 공개하고 연구하기 위해 만든 기관입니다.
챗 GPT에게 ‘한국의 대통령은 누구야?’라고 물었더니 ‘박근혜입니다’라는 답이 돌아왔습니다. (다음 날 해보니 김정은이라네요.)
스켈터랩스는 범용AI와 같은 제너럴리스트보다 ‘스페셜리스트AI’로 나아간다는 방향성을 잡았는데요. 대규모 불특정 데이터를 학습시키는 것보다 전문성을 갖춘 데이터를 학습시켜 좀 더 비즈니스적으로 접근해 서비스를 한다는 겁니다. 다양한 특정 영역의 비즈니스에 활용될 수 있게 한다는 거죠.
스켈터랩스의 대화형 AI는 3가지 스킬을 가지고 있는데요. ①기계독해 기술을 적용한 ‘질의 응답 챗봇’(지식) ②이용자와 감정적·일상적 대화가 가능한 ‘오픈 도메인 챗봇’(공감능력) ③예약이나 날씨 확인 등 이용자의 일을 대신해줄 수 있는 ‘목적 지향형 챗봇’(효용성) 등입니다.
그리고 각 대화 스킬을 목적과 의도에 맞게 전환할 수 있는 ‘다이얼로그 매니저’ 기술을 보유하고 있는데요. 쉽게 말해 AI랑 수다 떨다가 갑자기 식당 예약 좀 해달라고 주문할 수 있는 겁니다. 자연스러운 전환이 일어날 수 있도록 하는 거죠. 일반적으로 다른 서비스들은 각각의 스킬만을 서비스할 수 있는 형태라고 합니다.
초거대 AI도 방향성 자체는 자연스런 대화가 이뤄지도록 하는 것인데요. 때문에 목표를 향해 가는 방법이 다르다고 보면 됩니다.
스켈터랩스는 각 영역마다 자연스런 대화가 가능하도록 훈련을 시켜 연결하려는 그림을 그리고 있는 셈인데요. 모델이 작기 때문에 특정 영역마다 좀 더 믿을 만한 고품질 데이터를 제공하고 갱신하며 최적화하는 데에 상대적으로 수월하다고 합니다.
투자자 유의사항 :
이 콘텐츠에 게재된 내용들은 작성자의 의견을 정확하게 반영하고 있으며, 외부의 부당한 압력이나 간섭 없이 작성되었음을 확인합니다. 해당 글은 필자가 습득한 사실에 기초하여 작성하였으나, 그 정확성이나 완전성을 보장할 수 없으므로 참고자료로만 활용하시기 바라며, 투자 시 투자자 자신의 판단과 책임 하에 최종 결정을 하시기 바랍니다. 따라서, 해당 글은 어떠한 경우에도 투자자의 투자 결과에 대한 법적 책임소재의 증빙자료로 사용될 수 없습니다.