● GPT-5 계열과 Grok 4 계열이 압도적 1군.● 오픈소스(Deepseek, Qwen) 중에서도 일부 모델은 상위권 진입.● Claude, Llama 등은 중위권.● Llama 4 Maverick은 거의 실패 수준 점수.
첫댓글 gpt 수학 전혀 못풀던데
첫댓글 gpt 수학 전혀 못풀던데