chatGPT o3 mini 풀테스트(엔지니어링,논리,코딩)(ft.토목구조기술사)
https://youtu.be/gEmqi7P97QQ?si=9aMYsgvsKJU0xvT1
deepseek 공개에 깜짝 놀란 OpenAI가 o3 mini를 공개했습니다.
o3 mini모델은 low, midium, high 이렇게 세개가 있고
벤치마크에서는 o1을 앞서는 것으로 나타났습니다.
https://openai.com/index/openai-o3-mini/
o3 mini chat:
https://chatgpt.com/?model=o3-mini
이번 영사에서는 o3 mini의
엔지니어링 능력(필요철근량 계산)과, 논리문제 푸는 능력(10개),
코딩능력으로 2차방정식 풀고 그래프 르리는 웹앱 만들기를 시켜봤습니다.
모두 잘 해냈습니다.
철근량 구하는 문제는 단위 변환도 잘했고
철근량 구하는 공식을 알려주지도 않았는데
주어진 조건만으로 2차 방정식을 세웠고
근의 공식을 이용해서 필요철근량을 구했습니다.
물론 추론 모델만 할 수 있는 것은 아닙니다.
chatGPT 4o와 claude 3.5 sonnet 에게도 시켜봤는데
잘 풀었습니다.
논리 문제 10개는 잘 풀었습니다.
그런데 논리문제는 어제 qwen 2.5 max(추론모델 아님)도 잘 풀어서
추론모델만을 위한 문제를 개발해야 할 것 같습니다.
코딩 문제는 2차방정식의 해를 구하는 과정을 보여주는 웹앱입니다.
o3 mini가 만들어준 코드를 실행했는데 그래프가 보이지 않아서
고쳐달라고 했는데, 나중에 알고보니 그래프 관련 CDN의 문제였던 것
같습니다. 그래서 그래프 그리는 라이브러리를 다른 걸 써서 코딩을
하라고 시켜서 잘 해결되었습니다.
AI의 발전속도는 정말 엄청난 것 같습니다.
AI기술 발전이 사회에 어떤 영향을 미칠지
그리고 인류가 어떻게 사회시스템을 개선해야할지
고민이 필요한 시기인 것 같습니다.
00:00:00 오프닝
00:01:05 o3 mini 소개 (openai blog)
00:05:34 접속 주소
00:05:56 엔지니어링 테스트 (필요철근량 산정)
00:09:49 필요철근량 검증(claude artifacts)
00:11:16 4o로 필요철근량 산정
00:16:26 추론모델 or 일반모델?
00:16:45 claude 3.5 sonnet으로 필요철근량 산정
00:21:01 claude가 친근하게 느껴지는 이유
00:22:07 논리 문제 풀기
00:26:42 코딩 문제 2차 방정식 풀이 및 그래프 웹앱
00:35:22 마무리
#AI #인공지능 #chatGPT #o3mini #deepseek #claude #추론모델만을
#토목구조기술사 #토목공학 #토목시공기술사 #도로및공항기술사 #토질및기초기술사