|
SNS 기사보내기
SNS 기사보내기페이스북(으)로 기사보내기 트위터(으)로 기사보내기 카카오톡(으)로 기사보내기 네이버블로그(으)로 기사보내기 AI타임스 유튜브
(사진=투디지트)
투디지트가 대형언어모델(LLM) 국내 성능 평가 1위에 이어 세계 1위까지 차지했다. 이처럼 국내 인공지능(AI) 기업의 LLM 기술이 비약적으로 발전하고 있다.
투디지트(대표 박석준)는 허깅페이스가 운영하는 '오픈 LLM 리더보드’에서 세계 최초로 81점대(81.22)에 등극, 글로벌 1위를 차지했다고 26일 밝혔다. 2위인 글로벌 빅테크 세일즈포스보다 0.41점이 앞선다.
오픈 LLM 리더보드는 대형언어모델(LLM)로 추론, 상식, 언어 이해 종합, 환각 현상 방지, 대명사 참조, 수학 해결 등 6가지 분야에서 테스트를 진행하는 평가 지표다. 분야별 점수 평균으로 세계 순위를 결정한다.
6가지 세부 분야 중 추론(ARC) 세계 1위, 환각현상방지(hellaSwag)에서 세계 2위를 차지했다.
이에 앞서 투디지트는 지난 9일 한국어 LLM 리더보드에서 처음으로 평균 60점을 돌파하는 등 국내외 리더보드에서 돌풍을 일으키고 있다.국내 및 글로벌 리더보드 모두 첫 도전에서 한달여 만에 1위를 달성했다.
투디지트 관계자는 “LLM 분야에서 단기간 국내 1위, 세계 1위를 할 수 있었던 이유는 그간 세계 무대에서 경쟁하며 개발한 자연어 AI 기술이 있었기 때문”이라며 “보름도 안 되는 짧은 기간 동안 놀라운 성과를 거둘 수 있었다”라고 말했다.
투디지트의 약진과 함께, 전 세계 5747개 오픈 소스 LLM이 포진한 허깅페이스 리더보드에서는 국내 기업들이 초강세를 보이고 있다.
지난 2월 이미 허깅페이스 1위를 차지했던 모레가 78.55점으로 7위다. 또 지난 15일 LLM '루시아(LUXIA) 21.4B'로 매개변수 35B 이하 부문 1위를 달성한 솔트룩스가 77.91점으로 9위다.
이 밖에 올초 리더보드를 휩쓴 업스테이지가 74.2점, 뤼이드도 71.22점을 기록하며 순위에 올라 있다.
지난해 9월 한국지능정보사회진흥원(NIA)과 업스테이지 주최의 오픈 Ko-LLM 리더보드가 문을 연 이후 국내 AI 기업들의 기술력은 빠르게 늘고 있다.
국내 리더보드는 신규 개발자는 물론 대기업과 중견 AI 기업 등의 골고른 참여를 이끌어 내며, 6개월여 만에 1000개 모델 등록을 돌파했을 뿐더러 1위 점수도 20점 이상 끌어 올렸다.
투디지트 AI 랩 연구자들은 “그 동안 사업을 위한 개발에만 집중하느라 대회에 참여할 수 있는 시간이 없어서 아쉬웠다”라며 “국내와 세계 대회를 준비할 수 있어 매우 즐거웠다”라고 밝혔다.
또 “기술적으로는 ‘자체생성 데이터셋(SGD) 방식’이라는 최신 연구 결과를 적용해 볼 수 있었다”라며 “입력 데이터 정제, 모델에 맞게 데이터를 정제, 해당 태스크와 적합하지 않는 데이터를 제거하는 등의 전처리 기술로 ‘모델 학습 효율’을 빠르게 향상할 수 있다는 것을 다시 한번 입증했다”라고 설명했다.
박석준 투디지트 대표는 “세계 최고 수준 자연어 기술을 적용해 세상 모든 사람들의 핸드폰에 AI 1인 신문 서비스를 제공할 것”이라며 “국내AI 플랫폼 기업으로 세계 무대에서 사업을 하는 것이 우리의 목표”라고 말했다.
이어 “리더보드는 기업 홍보와 투자유치를 위해 한 순간 순위를 경쟁하는 곳이 아니다”라며 “순위는 계속 변하는 것은 당연하며., 이를 통해 국내 AI 생태계가 확장하기를 무엇보다 바라고 있다”라고 덧붙였다.
장세민 기자 semim99@aitimes.com
1 "AI가 사람보다 똑똑해진다"는 머스크 주장에 르쿤 반박..."자율주행도 못 만들면서"
2 오픈AI, GPT-5 앞서 'AI 음성 비서' 출시 예정... '보이스 엔진' 상표 출원
3 엔비디아, '1초 안에' 텍스트에서 3D 개체 생성하는 AI 도구 공개
4 이미지 생성 AI가 철자법 틀리는 이유...."LLM도 실제로 텍스트 못 읽어"
5 몇달 뒤 등장할 'GPT-5', 과연 어떤 모습일까
6 MIT "모든 이미지 생성 AI 중 가장 빠른 속도 모델 개발"
7 "수백세대 걸친 모델 교배로 성능 고도화"...사카나, '병합 진화 모델' 공개
8 '응답 전 독백 하는' LLM 프롬프트 기술 또 등장
9 "젠슨 황이 GTC서 입은 가죽 재킷은 1200만원짜리"
10 오픈AI, 전문가 '소라' 생성 영상 공개..."불가능했던 크리에이티브가 현실로"
|