최근 마무리된 Google I/O에는 수많은 AI 발표가 포함되었습니다. 기조연설에서는 Google의 Gemini AI 모델과 해당 모델이 예상대로 Workspace 및 Chrome과 같은 프로그램에 통합되는 방식을 다루었습니다.
실시간으로 이벤트를 시청할 수 없었다면 아래 요약에서 Google의 최신 뉴스를 확인할 수 있습니다.
이제 Google 렌즈를 통해 동영상을 녹화하여 검색할 수 있습니다.
이미 Google Lens를 사용하여 이미지 기반 검색을 수행할 수 있지만 이제는 비디오 기반 검색도 수행할 수 있습니다. 이는 Google의 큰 발전입니다. 즉, 찾고 싶은 내용을 동영상으로 녹화하고, 동영상 중간에 질문을 하면, 구글의 인공지능이 관련 웹 검색결과를 찾아주게 됩니다.
Gemini가 사진 라이브러리에 대한 질문에 답변해 드립니다.
이미지: 구글
올 여름, Google은 수년, 심지어 10년 이상 분량의 이미지를 검토해야 하는 모든 사람에게 유용할 수 있는 새로운 도구를 출시할 예정입니다. '사진에 물어보세요'를 사용하면 Gemini가 Google 포토 컬렉션을 검색하여 쿼리에 대한 답변을 얻을 수 있습니다. 하지만 단순히 고양이와 강아지의 이미지를 찾는 것만은 아닙니다. 그의 주장을 뒷받침하기 위해 Sundar Pichai CEO는 Gemini에게 번호판 번호를 물었습니다. 번호 자체가 응답이었고, 그 뒤에는 그것이 올바른지 확인할 수 있도록 사진이 첨부되었습니다.
Google의 주력 Gemini 모델이 더 빠르고 더 강력해졌습니다.
스크린샷: 유튜브
구글이 자사 포트폴리오에 새로운 AI 모델인 Gemini 1.5 Flash를 추가했습니다. 새로운 다중 모드 모델은 "좁고 빈도가 높으며 대기 시간이 짧은 작업"에 맞춰져 있지만 Gemini 1.5 Pro만큼 강력합니다. 이를 통해 빠른 답변을 생성하는 능력이 향상됩니다. Google은 Gemini 1.5의 수정 사항으로 인해 추론, 코딩 및 번역 기능이 향상될 것이라고 주장합니다. 또한 Google은 Gemini 1.5 Pro의 컨텍스트 창(또는 데이터 양)이 100만 개에서 200만 개 토큰으로 4배 증가했다고 주장합니다.
Gemini가 Workspace의 사용자와 합류합니다.
Gemini는 Google Meet 녹화를 요약합니다. 스크린샷: 유튜브
Google은 드라이브, Gmail, Docs, Sheets 및 Slides 애플리케이션의 사이드바에 최신 주류 언어 모델인 Gemini 1.5 Pro를 점진적으로 추가하고 있습니다. 다음 달 유료 고객을 위해 출시되면 Workspace 내의 범용 보조자가 되어 어디에 있든 드라이브의 모든 콘텐츠에서 정보를 가져올 수 있습니다. 또한 현재 보고 있는 문서의 정보를 활용하여 이메일을 작성하거나 나중에 읽고 있는 이메일에 답장하도록 미리 알림을 예약할 수 있습니다. 일부 초기 테스터는 이전에 이러한 기능에 액세스할 수 있었지만 Google은 다음 달부터 모든 유료 Gemini 가입자가 이 기능을 활용할 수 있을 것이라고 밝혔습니다.
Project Astra는 Google의 Star Trek AI 미래 입니다.
Google의 Project Astra는 소지품이 어디에 있는지 기억하고 기기의 카메라를 통해 보는 내용을 모니터링 및 이해하며 사용자를 대신하여 작업을 수행할 수 있는 포괄적인 가상 비서로 성장할 것으로 믿는 다중 모드 AI 도우미입니다. 회사의 목표는 귀하와 대화하는 것 외에도 귀하를 대신하여 작업을 수행할 수 있는 진정한 AI 에이전트가 되는 것입니다. 이는 올해 I/O의 가장 놀라운 데모 중 일부를 구동합니다.
Veo는 크리에이터에게 Sora 스타일의 비디오 생성을 제공합니다.
Veo의 출력 샘플. 이미지: 구글
텍스트, 이미지, 비디오 기반 요청에 응답하여 1080p 비디오를 생성할 수 있는 새로운 생성 AI 모델을 통해 Google은 OpenAI의 Sora에 응답했습니다. 타임랩스, 항공 사진 등 다양한 장르의 비디오를 조정하는 데 더 많은 프롬프트를 사용할 수 있습니다. 영화에 사용하기 위해 Veo를 할리우드로 밀고 나가는 것 외에도 회사는 이미 YouTube 비디오에 사용하기 위해 특정 제작자에게 이를 제공하고 있습니다.
Gems는 맞춤형 챗봇 생성을 Gemini에 가져옵니다.
Google은 독점적인 챗봇 빌더인 Gems를 출시합니다. OpenAI의 GPT와 유사하게 Gemini는 Gems를 통해 사용자가 응답 및 전문 분야를 변경하도록 지시할 수 있습니다. 귀하는 곧 (Gemini Advanced 구독자라면) 매일의 영감과 훈련 계획을 갖춘 끈질기고 낙관적인 달리기 코치가 될 수 있게 될 것입니다. 이것은 최악의 악몽입니다.
쌍둥이자리는 더 나은 대화 파트너가 됩니다
Gemini와의 음성 대화를 더욱 유기적으로 만드는 것이 새로운 Gemini Live 기능의 목표입니다. 사용자는 문장 중간에 챗봇을 멈추거나, 스마트폰 카메라를 통해 관찰하도록 요청하고, 보는 내용에 대해 실시간 해설을 제공할 수 있습니다. 챗봇의 목소리도 개성을 더해 더욱 향상될 것입니다. 또한 Gemini는 멀티모달 기능(예: 전단지의 정보를 캘린더에 추가)을 사용하여 Google Calendar, Tasks 및 Keep에서 데이터를 업데이트하거나 가져올 수 있는 새로운 통합 기능을 확보하고 있습니다.
Circle to Search는 이제 수학 문제를 해결하는 데 도움이 될 수 있습니다
이제 Android 휴대폰이나 태블릿에서 수학 문제에 동그라미를 쳐서 문제 해결에 도움을 받을 수 있습니다. Google의 AI는 문제를 해결할 수 없고 아이들의 학업 부정행위를 돕지는 않지만 문제를 관리 가능한 단계로 분류할 수 있습니다.
Google 검색이 AI 점검을 받습니다.
이미지: 구글
이번 주에 Google은 이전에 "검색 생성 경험"으로 알려진 "AI 개요"를 모든 미국 사용자에게 제공할 예정입니다. 이제 "전문화된" Gemini 모델이 인터넷에서 요약된 응답을 생성하고 결과 페이지에 추가합니다(Arc Search 또는 Perplexity와 같은 AI 검색 도구로 생각).
Android는 AI 기반 사기 탐지 기능을 제공합니다.
이번 주에 Google은 이전에 "검색 생성 경험"으로 알려진 "AI 개요"를 모든 미국 사용자에게 제공할 예정입니다. 이제 "전문화된" Gemini 모델이 인터넷에서 요약된 응답을 생성하고 결과 페이지에 추가합니다(Arc Search 또는 Perplexity와 같은 AI 검색 도구로 생각).
안드로이드 기기는 AI를 더 똑똑하게 만들 예정이다
이미지: 구글.
Google에 따르면 사용자는 곧 Gemini에게 화면 영상과 관련하여 질문을 할 수 있으며 시스템은 자동으로 나타나는 자막을 사용하여 응답할 것입니다. 또한 PDF를 흡수하여 비용을 지불하는 Gemini Advanced 사용자에게 정보를 제공할 수 있습니다. 앞으로 몇 달 동안 Android용 Gemini는 이러한 업데이트와 기타 다중 모드 업데이트를 받게 됩니다.
구글 크롬에 AI 비서가 생긴다
스크린샷: 유튜브
Google은 이제 데스크톱 사용자용 Chrome이 경량 Gemini Nano 변형을 지원할 것이라고 밝혔습니다. 기기 내 AI의 도움으로 Chrome에 내장된 어시스턴트가 제품 평가, 소셜 미디어 게시 및 기타 목적을 위한 텍스트 작성을 지원합니다.
Google, SynthID AI 워터마킹 업그레이드
스크린샷: 유튜브
Google은 SynthID의 기능이 성장하고 있다고 말합니다. 이제 인공 지능(AI)이 제작한 영화를 인식할 수 있으며 새로운 Veo 비디오 생성기로 만든 콘텐츠에 워터마킹을 통합할 수 있습니다.
최근 GreatGameIndia 가 보도한 바에 따르면 Google의 AI는 역사적 부정확성에 대한 비판에 직면했고 편견을 일깨웠습니다 . 구글 공동 창업자인 세르게이 브린(Sergey Brin)은 Gemini Hackathon에서 테스트가 불충분했다는 이유