|
|
2026년 가장 똑똑한 AI 모델 순위
Voronoi 앱 에서 다른 여러 데이터 제작자들이 만든 이와 같은 시각화 자료를 확인해 보세요 . iOS 또는 Android 에서 무료로 다운로드하고 다양한 신뢰할 수 있는 출처에서 제공하는 놀라운 데이터 기반 차트를 만나보세요.
핵심 요약
더욱 똑똑한 AI 모델을 개발하기 위한 경쟁이 최상위권에서 더욱 치열해지고 있습니다.
테르조(Terzo) 의 후원으로 비주얼 캐피털리스트(Visual Capitalist)의 AI 위크 의 일환으로 제작된 이 시각화 자료는 트래킹AI(TrackingAI) 의 데이터를 사용하여 주요 시스템 순위를 매깁니다 . 트래킹AI는 2026년 4월 기준 멘사 노르웨이 IQ 테스트에서 모델 성능을 벤치마킹합니다.
결과는 현재 누가 선두인지, 그리고 상위권 경쟁자들 간의 격차가 얼마나 작은지를 보여주며, 여러 최첨단 모델들이 순위표 상위권에 밀집되어 있음을 나타냅니다.
공동 선두
이 순위는 오늘날 최고의 AI 모델들이 추상적인 패턴 인식 작업에서 어떤 성능을 보이는지, 그리고 경쟁이 얼마나 치열해졌는지를 보여주는 단면을 제공합니다.
아래 표에서 볼 수 있듯이, 이제 최상위 모델들 간의 격차는 매우 작습니다.
10152550100페이지당 항목 수
찾다:
모델멘사 노르웨이 IQ (2026년 4월)
| Grok-4.20 전문가 모드 | 145 |
| OpenAI GPT 5.4 Pro (Vision) | 145 |
| 제미니 3.1 프로 미리보기 | 141 |
| OpenAI GPT 5.4 사고(비전) | 139 |
| OpenAI GPT 5.3 | 136 |
| Grok-4.20 전문가 모드(Vision) | 133 |
| OpenAI GPT 5.4 사고력 | 133 |
| 메타 뮤즈 스파크 | 133 |
| 제미니 3.1 프로 프리뷰(비전) | 132 |
| 퀀 3.5 | 130 |
| 클로드-4.6 작품 | 130 |
| 키미 K2.5 | 127 |
| 마누스 | 115 |
| 딥시크 R1 | 112 |
| 딥시크 V3 | 111 |
총 26개 항목 중 1~15번째 항목을 표시합니다.
‹12›
가장 주목할 점은 순위표 상위권 경쟁이 매우 치열해졌다는 것입니다. Grok-4.20 Expert Mode와 OpenAI GPT 5.4 Pro (Vision)가 145점 으로 공동 1위를 차지했고 , Gemini 3.1 Pro Preview가 141점 으로 그 뒤를 바짝 쫓고 있습니다 .
이처럼 점수 차이가 크지 않다는 것은 최첨단 AI 모델들이 상위권에서 점점 더 수렴하고 있으며, 단 몇 점 차이로도 순위가 바뀔 수 있음을 시사합니다.
2025년 대비 향상된 수치 또한 주목할 만합니다. 작년 최고 점수는 135점이었는데, 올해는 145점으로 상승하여 주요 모델들이 이 기준점을 얼마나 빠르게 개선하고 있는지를 보여줍니다.
모든 모델이 그 속도를 따라잡는 것은 아닙니다. 주요 AI 개발사 중 미스트랄의 최고 모델은 이 데이터 세트에서 97 점으로 가장 낮은 순위를 기록했는데, 이는 선두 그룹보다 훨씬 낮은 점수입니다.
TrackingAI는 어떻게 테스트를 진행할까요?
TrackingAI는 35개의 시각 패턴 퍼즐로 구성된 공개 Mensa Norway 테스트를 사용합니다. 비전 모델에는 질문이 음성으로 제공되는 반면, 비전 모델에는 원본 이미지가 직접 제공됩니다.
따라서 이러한 결과는 전반적인 지능을 확정적으로 측정하는 기준이 아니라, 하나의 벤치마크 비교로 이해하는 것이 가장 적절합니다. 검사가 근본적으로 시각적인 특성을 가지기 때문에, 문제 제시 방식에 따라 모델 점수가 달라질 수 있습니다.
이 기준이 중요한 이유
TrackingAI의 리더보드는 시간 경과에 따른 추론 성능을 비교하는 간단하고 친숙한 방법을 제공하기 때문에 유용합니다. 또한, 모델이 답변을 거부할 경우 동일한 질문을 최대 10번까지 다시 요청하고 가장 최근 답변을 점수에 사용한다고 명시되어 있습니다.
하지만 IQ 방식의 벤치마크는 능력의 일부분만을 측정할 뿐입니다. 코딩 능력, 사실적 신뢰성, 도구 활용 능력, 전문 분야에서의 성과 등 실제 AI 활용에 중요한 모든 요소를 측정하지는 못합니다.