애플은 최근 ReALM(Reference Resolution As Language Modeling)이라는 새로운 AI 모델을 개발했습니다. ReALM은 특히 온디바이스 AI에 특화된 소형 언어 모델(sLM)로, 아이폰과 같은 기기에서 효율적으로 작동하도록 설계되었습니다.
ReALM의 핵심 기능:
ReALM의 가장 큰 특징은 참조 해결(Reference Resolution) 능력입니다. 이는 대화 맥락 속에서 사용자가 지칭하는 특정 대상이나 정보를 정확하게 파악하는 것을 의미합니다. 예를 들어, 사용자가 "이 노래 틀어줘"라고 말했을 때, ReALM은 "이 노래"가 어떤 곡인지 화면에 표시된 정보를 바탕으로 파악하여 명령을 수행할 수 있습니다.
ReALM의 작동 방식:
ReALM은 시각적인 정보를 텍스트 기반으로 생성하여 언어 모델에 제공합니다. 예를 들어, 화면에 여러 곡의 노래 제목과 아티스트 정보가 표시되어 있다면, ReALM은 이 정보를 텍스트로 변환하여 언어 모델이 "이 노래"가 어떤 곡인지 파악하는 데 도움을 줍니다.
ReALM의 활용 가능성:
ReALM은 시리(Siri)와 같은 음성 비서의 성능을 향상시키는 데 기여할 수 있습니다. 사용자의 모호한 요청이나 복잡한 맥락을 더 잘 이해하고, 화면에 표시된 정보를 활용하여 더욱 정확한 답변을 제공할 수 있게 됩니다. 또한, 다양한 앱과 서비스에서 사용자 경험을 향상시키는 데 활용될 수 있습니다.
ReALM의 특징:
출처. 구글 Gemini 2.0 Flash