구글에서 'Gemini 3' 등장/xAI가 신형 AI 모델 'Grok 4.1'을 공개 / 11/23(일) / ITmedia PC USER
https://news.yahoo.co.jp/articles/60b6b8fbda71814b155d2e8664a961b2ef0acf76?page=1
구글이 최신 AI 모델 '제미니 3'를 발표했다
깜빡 잊고 있었지만, 조금 신경이 쓰이는--그런 뉴스를 주말에 "원샷"하는 연재. 이번에는 11월 16일 주를 중심으로 공개된 주요 뉴스를 한번에 체크해 볼까요!
【이미지로 보는】Microsoft가 동영상 생성 AI 'Sora 2'가 Microsoft 365 Copilot에서 이용 가능하게 되었다고 발표했다
◇ 구글, 'Gemini 3' 공개
Google은 11월 18일, 동사의 AI 모델 「Gemini」시리즈의 최신판이 되는 「Gemini 3」를 발표했다. Google 검색의 AI 모드, 제미니 앱, 개발자용 플랫폼 각각에서 순차적으로 제공을 시작한다.
Gemini 3는 멀티모달에서 가장 고성능인 모델로 최첨단 추론 능력을 기반으로 한다. 강력한 에이전트 기능과 바이브 코딩 모델을 탑재해 보다 풍부한 시각 표현과 깊은 양방향성을 구현했다고 한다.
주요 AI 벤치마크에서는 Gemini 2.5 Pro를 크게 웃도는 성능을 보였다. LLM의 성능을 비교/평가하기 위한 오픈한 벤치마크 플랫폼 「LMArena」에서는, 「1501 Elo」라고 하는 스코어로 톱에 서서, 박사 학위 레벨의 추론 능력을 필요로 하는 Humanity's Last Exam이나 GPQA Diamond로, 최고 스코어를 달성했다고 한다.
짧은 프롬프트에서도 문맥과 의도를 정확하게 파악할 수 있고, 응답은 간결하고 직접적이며 진정한 통찰을 제공하는 사고 파트너로 기능한다는 것이다.
이밖에 강화된 추론 모드 'Gemini 3 Deep Think'도 도입된다. 보다 복잡한 문제 해결이 가능해 ARC-AGI에서는 45.1%라는 높은 점수를 기록하고 있다. 이것은 향후 몇 주 이내에 Google AI Ultra의 서브스크립션 유저에게 제공될 예정이다.
◇ xAI, 신형 AI 모델 'Grok 4.1' 공개
xAI는 11월 17일, AI 모델 「Grok」의 최신판이 되는 「Grok 4.1」을 발표했다. Web판 Grok, X, iOS/Android 앱에서, 전 유저에게 제공을 개시하고 있다.
Grok 4.1은 「창조적, 감정적, 협동적인 교환에 있어서 예외적인 능력」을 발휘하도록 설계되어 있으며, 뉘앙스를 포함한 의도의 이해력과 인격의 일관성이 향상되고 있다고 한다. 이 실현을 위해 xAI는 Grok4에서 사용한 대규모 강화 학습 인프라를 활용해 스타일/퍼스낼리티/유용성/얼라인먼트의 최적화에 주력했다고 한다.
xAI에 따르면 실전 환경에서의 2주간 블라인드 테스트에서는 이전 모델 대비 64.78% 확률로 Grok 4.1이 선호됐다.
LMArena의 Text Arena 리더 보드에서는, 추론 모드 「Grok 4.1 Thinking」이 1483 Elo로 한때, 선두에 올랐다(그 후, Google의 Gemini3가 1501로 선두를 탈취). 비추론 모드인 'Grok 4.1'도 1465 Elo로 2위에 올라 다른 모델의 완전추론 구성을 뛰어넘는 성능을 보였다.
또한, 할시네이션도 기존 모델에서 저감하고 있으며, 비추론 모드에서는 Grok4 Fast의 12.09%에서 4.22%로 약 65%의 삭감을 달성. FactScore 벤치마크에서도 9.89%에서 2.97%로 대폭 개선됐다고 한다.
◇ OpenAI가 교육현장용 AI 모델 'Chat GPT for Teachers'를 발표
OpenAI는 11월 19일, K-12(유치원에서 고등학교까지)의 교원 전용으로 특화한 「ChatGPT for Teachers」를 발표했다. 미국의 인증된 교원에게 2027년 6월까지 무료로 제공된다.
ChatGPT for Teachers는 교원이 교재를 안전하게 다루고 수업 준비를 효율화하며 동료와 연계할 수 있는 안전한 워크스페이스를 제공한다. 학교나 학군의 리더는 FERPA(가족교육권 및 프라이버시법)의 요건에 준거한 프라이버시, 보안, 컴플라이언스 프로그램을 갖춘 단일 계정으로 교사와 학교 직원을 통합할 수 있다.
Chat GPT for Teachers에는 GPT-5.1 Auto에 대한 무제한 액세스, 파일 업로드, 커넥터, 이미지 생성 등의 기능이 포함된다. 주요 기능은 다음과 같다.
・ 교육 수준의 보안과 컴플라이언스: ChatGPT for Teachers에서 공유되는 정보는 기본적으로 모델 훈련에 사용되지 않는다. 또한 워크스페이스는 FERPA 요건에 준거한다
・ 맞춤형 지도지원 : 학년, 커리큘럼, 원하는 형식 등의 정보를 기억할 수 있으며, 지도 스타일과 교실에 맞게 맞춤형으로 답변을 받을 수 있다
・ 툴 연계: Canva에서 프레젠테이션을 작성하거나 Google Drive 또는 Microsoft 365에서 수업 계획과 파일을 가져오거나 하여 준비에 걸리는 시간을 절약할 수 있다
・ 실제 교사의 예: ChatGPT를 이미 사용하고 있는 교사의 바로 사용할 수 있는 아이디어나 프롬프트를 찾을 수 있다
・ 협업 : 맞춤형 GPT를 사용하여 학교 및 학군 내 다른 교사들과 함께 템플릿을 만들거나 공유 프로젝트로 함께 레슨 및 프레젠테이션을 계획할 수 있는
・ 관리 통제: 학교 및 학군 리더는 자체 조직 도메인을 신청함으로써 교육자를 하나의 작업 공간으로 통합할 수 있다. 역할 기반 접근 제어 기능을 갖추고 SAML SSO를 통해 계정을 보호할 수 있다
2027년 6월 이후의 가격에 대해서는, 교육자에게 있어서 적당한 가격을 유지하는 것을 목표로 하고 있다고 한다.
◇ 클라우드플레어, 국내 출판사 저작권 침해 소송에 5억엔 배상 판결
KADOKAWA는 11월 19일, 코단샤, 슈에이샤, 쇼가쿠칸과 공동으로, 미국 클라우드플레어를 상대로 제기하고 있던 저작권 침해 소송에 대해, 도쿄 지방재판소가 클라우드플레어의 손해배상 책임을 인정하는 판결을 선고했다고 발표했다.
4사는, 4000 작품 이상의 만화를 무허락으로 게재해, 최성기에 월간 3억 이상의 액세스를 모으고 있던 2개의 거대 만화 해적판 사이트에 CDN(컨텐츠 딜리버리 네트워크) 서비스를 제공하고 있던 Cloudflare에 대해, 서비스의 악용을 통지. 동사가 관리하는 서버로부터 해적판 컨텐츠의 전달 정지등의 대응을 요구했지만, Cloudflare는 통지 수령 후에도 서비스 제공을 계속했다.
게다가 동사는, 4사로부터의 침해 통지 뿐만이 아니라, 미국 법원으로부터의 정보 개시 명령을 수령한 후에도, 만화 해적판 사이트에의 서비스 제공을 계속했기 때문에, 4사는 2022년 2월 1일에 제소를 단행했다.
이번 판결에서는 Cloudflare가 4사로부터 침해 통지를 받으면서도 적시/적절한 대응을 하지 않고, 만연히 서비스 제공을 계속한 것이 저작권 침해의 방조에 해당한다며 손해배상 책임을 인정했다. 판결로 인정된 손해액은 4사(4작품)에서 총액 약 36억엔. 다만 4사가 일부만 청구했기 때문에, 판결 주문에서는 합계 약 5억엔의 지불이 명령되었다.
판결은 클라우드플레어가 본인 확인 절차를 일절 거치지 않고 '강도적인 익명성이 확보된 상황하'에서 거대 만화 해적판 사이트의 운영을 가능하게 한 점을 이 회사의 책임을 인정하는 이유로 중시하고 있다.
4사는, CDN 서비스 그 자체는 적법한 컨텐츠의 전달에 유익한 서비스라고 하면서도, 해적판 사이트에 악용되면 위법 컨텐츠가 효율적이고 대규모로 전달되어 버린다고 지적. "이번 판결이 해적판 사이트에 의한 CDN 서비스 악용 방지로 이어져 창작자에게 적절한 대가가 환원될 수 있는 콘텐츠 창작 사이클이 유지되기를 기대한다"고 밝혔다.
또한 Cloudflare는 보도기관을 대상으로 발표한 성명에서 판결에 불복하여 항소할 의향을 보이고 있다. 과거에 Cloudflare는 「일본의 권리자를 지원하기 위해서 의무 이상의 대응을 실시해 왔다」라고 주장해, 권리자와 호스팅 프로바이더를 연결하는 남용 방지 프로세스를 채용하고 있었다고 하고 있었다.
◇ 동영상 생성 AI 'Sora 2'를 'Microsoft 365 Copilot'에서 이용할 수 있게
마이크로소프트는 11월 18일 오픈AI의 동영상/음성 생성 모델 '쏘라2'가 마이크로소프트 365 코필롯에서 이용 가능해졌다고 발표했다. Microsoft의 Frontier 프로그램에 옵트인하고 있는 Microsoft 365 Copilot 라이센스 사용자는 Create Experience에서 동영상 생성 기능에 접근할 수 있다.
Sora 2는 9월에 발표된 최신 동영상/음성 생성 모델. 물리법칙을 존중한 동영상 생성이 가능하고 농구공이 백보드로 튕겨 나가는 등 객체가 자연스럽게 움직인다. 고도의 리얼리즘을 가진 배경음이나 음성, 효과음도 생성할 수 있으며 동영상에는 화면상의 액션에 맞춘 음성이 포함된다. 복수 샷에 걸친 복잡한 지시에 따라, 리얼리스틱/시네마틱/애니메이션 스타일에 대응. 카메라 앵글/샷 타입/스타일 지정이 가능하다.
생성된 동영상은 SharePoint Online 또는 OneDrive for Business에 저장되며 OpenAI가 데이터를 처리하지는 않는 것으로 알려졌다. 또, AI 모델의 트레이닝에도 사용되는 일은 없다고 하고 있다.
◇ 3D 그리기 성능 테스트하는 Crystal Mark 3D25 등장
CrystalDiskmark나 CrystalDiskInfo를 다루는 히요히요씨가 11월 20일, 3 D성능(GLSL/WebGL)을 원클릭으로 계측할 수 있는 3 D벤치마크 소프트 「CrystalMark 3D25」를 릴리스했다. 대응 OS는 Windows 11로, 공식 사이트등에서 다운로드할 수 있다.
4개의 씬을 탑재하고 있어 Crystal Disk Mark와 같이 「All」버튼으로 모든 씬의 벤치마크를 차례로 실행한다. 스코어는, 1초간에 그린 픽셀수를 기반으로 산출된다. 계측한 점수는 X에 투고하거나 Cristal Mark DB에 등록하거나 할 수 있다.
덧붙여 본 벤치마크에 포함되는 4개의 씬은, 모두 데모 씬이라고 불리는 영상 작품이다. 실시간으로 영상이나 음악을 생성하는 프로그램(데모)을 작성/감상하는 컴퓨터의 서브 컬처로, 일본의 데모 씬을 지지하는 4명으로부터 제공을 받았다는 것이다. 이 벤치마크 자체, 데모 씬의 매력을 PC 애호가(벤치 마커)에게 알리는 것을 목표로 개발했다고 하고 있다.
ITmedia PC USER