▷동사는 언론을 통해 자체 개발한 의료 특화 파운데이션모델 ‘아름.H(ALLM.H)’가 한국 의사 국가시험(KMLE) 기출문항 기반 의료 AI 평가 벤치마크인 ‘KorMedMCQA Doctor Test’에서 96.78%의 정답률을 기록하며 현존 최고 성능(SOTA)을 달성 했다고 밝힘. 이는 앤트로픽의 'Claude Opus4(96.55%)', 오픈AI의 'GPT-5.1(90.11%)', 구글 'Gemini 2.5 Pro(90.8%)'를 모두 웃도는 수준으로, 국내 의료 특화 AI 모델의 경쟁력을 입증한 사례로 의미가 크다고 알려짐. ▷동사는 ALLM.H를 단일 모델에 그치지 않고, 진료과별 특성을 반영한 패밀리’ 구조로 확장해 나갈 계획임. ALLM.H를 앵커 모델로 삼아 각 전문 진료과에최적화된 AI 생태계를 구축하고, 후속 모델들의 성능과 벤치마크 결과도 순차적으로 공개할 예정임. 이를 통해 실제 의료 현장에서 활용 가능한 전문 의료 AI 체계를 단계적으로 고도화한다는 방침이라고 전해짐. ▷이와 관련, 박외진 동사 대표는 "ALLM.H는 아크릴이 보유한 대규모 모델 학습·평가 인프라와 LLM 평가 플랫폼 ‘조나단(Jonathan)’을 통해 축적한 모델 최적화 노하우가 결합된 결과물"이라며, "31B 규모모델로 Claude Opus 4와 GPT-5.1을 넘어서는 성능을 달성한 것은 모델의 크기보다 데이터 전략과 학습 파이프라인 설계가 핵심이라는 점을 보여준다"고 언급. 이어 "이번에 검증된 특화 파인튜닝 기술은 향후 조나단 플랫폼에 탑재돼 의료뿐 아니라 금융, 법률, 제조 등 다양한 산업도메인으로 확장될 예정"이라며, "고객이 자체 도메인 데이터만 보유하면 특화 모델의 학습부터 평가, 배포까지 가능한 엔드투엔드 파이프라인을 제공해 산업별 AI 내재화를 앞당길 것"이라고 밝힘. |