구글의 AI 개요 기능이 시간당 수백만 건의 잘못된 답변을 쏟아내고 있다는 충격적인 연구 결과가 나왔습니다.
https://nypost.com/2026/04/09/business/googles-ai-overviews-spew-out-millions-of-false-answers-per-hour-bombshell-study/
구글의 인공지능 기반 검색 결과가 시간당 수천만 건의 부정확한 답변을 쏟아내고 있으며, 동시에 이 거대 기술 기업이 재정난에 시달리는 뉴스 매체로부터 방문자와 광고 수익을 빼앗아 가고 있다는 충격적인 분석 결과가 나왔습니다.
구글의 AI 개요의 정확성을 테스트하기 위해 스타트업 오우미(Oumi)는 구글의 제미니 2 모델이 생성한 4,326개의 검색 결과와 더욱 발전된 제미니 3 모델이 생성한 동일한 수의 결과를 검토했습니다.
분석 결과, 해당 모델들은 각각 85%와 91%의 정확도를 보였다.
구글이 2026년 한 해에만 5조 명이 넘는 검색 사용자를 처리할 것으로 예상되는 상황에서, AI 개요는 매분 수십만 건의 오류를 포함한 가짜 뉴스를 쏟아내고 있으며, 사용자들은 이를 전혀 알아차리지 못하고 있습니다.
3
Oumi의 데이터에 따르면 AI Overviews는 분당 수십만 건의 잘못된 답변을 생성하는 것으로 나타났습니다.블룸버그 (게티 이미지 제공)
00:00
00:00
뉴욕 타임스가 오우미의 분석에 대해 가장 먼저 보도 했습니다 .
워싱턴 포스트를 포함해 2,000개 이상의 언론사를 대표하는 언론/미디어 연합의 회장 겸 CEO인 다니엘 코피는 "구글 AI 개요는 클릭 수에 의존해 양질의 저널리즘 콘텐츠 제작 자금을 마련하는 언론사들에게 재앙이었을 뿐만 아니라 정확한 정보를 찾는 사용자들에게도 실망감을 안겨주었다"고 말했다.
오우미가 타임스에 제공한 예시에 따르면, 오답에는 음악가 밥 말리의 집이 박물관으로 개조된 연도를 잘못 기재하거나, 전 메이저리그 구원 투수 딕 드라고가 사망한 연도를 잘못 기재하고, 요요 마가 2007년에 클래식 음악 명예의 전당에 헌액되었음에도 불구하고 헌액 기록이 없다고 주장하는 등 몇 가지 기본적인 실수가 포함되어 있었습니다.
2024년부터 구글 검색 결과 상단에는 AI 개요가 표시되고 있으며, 기존의 뉴스 매체 링크들은 사실상 검색 결과에서 밀려나 있습니다. 언론사들은 순다르 피차이 CEO가 이끄는 구글이 자사의 AI 모델을 학습시키기 위해 언론사의 연구 결과를 무단으로 도용하고 정당한 출처 표기나 보상 없이 사용했다고 오랫동안 비난해 왔습니다.
더 알아보기
안전 우려가 커지면서 사우스웨스트 항공은 인기 여행 기기의 승객 1인당 사용을 1대로 제한합니다.
뉴욕시의 한 법안은 아마존이 수천 명의 지역 배송 직원을 고용하도록 강제하여 고객 배송비를 급증시킬 것으로 예상됩니다.
개인 비서가 고령의 살로몬 브라더스 임원으로부터 1천만 달러를 횡령해 루이비통과 구찌를 구입한 혐의로 유죄를 인정했습니다.
코피는 "인터넷상의 거의 모든 출처에서 데이터를 가져와 알고리즘으로 생성된 답변은 결코 신뢰할 수 없다"고 말했다.
"출판사들은 독자들에게 제공하는 콘텐츠의 사실 여부를 제대로 확인하기 위해 막대한 시간과 비용을 투자하는 반면, 구글의 AI 개요는 아무런 감독이나 책임 없이 제작됩니다."
AI Overviews는 페이스북 페이지, 블로그 게시물, 위키피디아 항목과 같이 신뢰성이 의심스럽거나 쉽게 편집될 수 있는 출처의 정보를 마치 사실인 것처럼 인용하는 경향이 있습니다.
3
구글은 오우미의 분석에 결함이 있다고 주장합니다.볼터케 – stock.adobe.com
해당 기능은 가짜 뉴스를 퍼뜨리도록 속이기 쉬워 보입니다.
타임스는 BBC 팟캐스트 진행자 토마스 저메인이 자신의 블로그 게시물에서 자신을 "핫도그 먹기 최고 테크 저널리스트 중 한 명"이라고 선언한 사례를 인용했습니다.
구글의 AI 요약 기능은 하루 만에 해당 정보를 흡수하여 제르맹이 "먹방 대회 '뉴스 부문'에서의 뛰어난 실력으로 악명을 얻었다"고 주장하기 시작했습니다.
Oumi의 분석은 10월부터 2월 사이에 진행되었으며, OpenAI에서 개발하고 AI 모델의 정확도를 평가하는 데 사용되는 잘 알려진 벤치마크 테스트인 SimpleQA를 활용했습니다.
제미니 2와 제미니 3에서 정확도가 향상되기는 했지만, 오우미의 연구에 따르면 AI Overviews는 정보 출처를 정확하게 인용하는 면에서 오히려 악화된 것으로 나타났습니다.
3
구글 CEO 순다르 피차이가 한 행사에 참석했다.블룸버그 (게티 이미지 제공)
보고서에 따르면, 구글이 제공한 링크가 AI 요약에 포함된 정보를 뒷받침하지 못하는, 즉 "근거가 부족한" AI 개요 답변의 비율이 제미니 2의 37%에서 제미니 3의 51%로 급증했습니다.
구글 대변인은 오우미의 연구에 "심각한 결함"이 있다고 지적하며, 그 이유 중 하나로 SimpleQA 벤치마크 테스트 데이터 세트 자체에 부정확한 정보가 포함되어 있다는 점을 들었습니다.
또한 해당 회사는 오우미가 자체 개발한 AI 모델인 '홀오우미(HallOumi)'에 의존하여 분석을 수행하는 방식에 의문을 제기했는데, 이는 해당 모델이 오류를 범할 위험이 있다는 점을 지적한 것이다.
"이 방식은 오류가 많은 것으로 악명 높은 오래된 기준을 바탕으로 하나의 AI를 다른 AI에 적용하여 평가하는 것으로, 사람들이 실제로 구글에서 검색하는 내용을 반영하지 않습니다."라고 대변인은 말했습니다. "AI 개요는 업계 최고 수준의 정확도를 자랑하는 당사의 제미니 모델을 기반으로 구축되었으며, 모든 검색 기능에 적용하는 것과 동일한 높은 품질 기준을 충족합니다."
15
어떻게 생각하세요? 댓글을 남겨주세요.
워싱턴 포스트가 보도한 바와 같이 , AI Overviews는 출시 이후 정확한 정보를 제공하는 데 어려움을 겪어왔으며, 이전에는 사용자에게 피자 소스에 접착제를 넣으라고 권하거나 어린이에게 담배의 "건강상 이점"을 과장하는 등의 행위를 저질렀습니다.