구글, 검색 알고리즘 관련 대규모 문서 유출 사실 인정
https://nypost.com/2024/05/30/business/google-admits-massive-leak-related-to-search-is-authentic/
구글은 검색 엔진과 관련된 약 2,500개의 내부 문서가 유출된 사실이 사실임을 확인했으며, 한 전문가는 이 자료를 통해 신비한 알고리즘과 관련하여 "구글이 우리에게 한 가지 말을 하고 다른 일을 한다"는 사실을 보여준다고 말했습니다.
이 거대 기술 기업은 온라인 정보 흐름, 트래픽, 광고 수익에 막대한 영향력을 행사하면서도 검색 엔진의 작동 방식에 대해 비밀을 유지해 왔습니다.
일부 세부정보는 순위를 계산하는 데 사용되는 요소와 사용되지 않는 요소에 관해 Google 직원이 과거에 발표한 공개 성명과 모순되는 것으로 보입니다.
예를 들어, 2016년 Google 검색 직원은 회사에 '웹사이트 권위 점수'가 없다고 말했습니다.
회사는 또한 검색 순위에서 Chrome 데이터 사용을 명시적으로 거부했습니다 .
00:00
00:00
그러나 문서의 정보에 따르면 Google은 순위를 결정하기 위해 클릭률, Chrome 웹 브라우저의 데이터, 웹사이트 크기 및 '도메인 권한'이라는 요소(특정 주제에 대한 웹사이트의 중요성이나 관련성을 측정하는 척도)를 고려합니다.
더 탐색하기
미국 주택 시장에서 폐쇄되었나요? 그동안 '복수'에서 승리하는 방법은 다음과 같습니다.
쇼당 100만 달러에 달하는 J.Lo의 거래, 새 앨범, 콘서트 투어 실패로 인해 위험에 처한 베가스 레지던시: 출처
인기 슈퍼마켓, 북동부에서 실적이 저조한 수많은 매장 폐쇄
삼
일부 전문가들은 구글 문서 유출이 검색 알고리즘 사상 최대 규모라고 설명했습니다.AP
"여기서 가장 중요한 점은 Google이 우리에게 한 가지 말을 하고 다른 일을 한다는 것입니다."라고 iPullRank CEO Michael King이 The Post에 말했습니다.
King은 “이 문서는 우리에게 이에 대한 명확성을 제공합니다.”라고 덧붙였습니다. "Google이 검색에 사용하는 레시피는 없지만 이제 재료가 무엇인지에 대한 명확한 정보가 있습니다."
무역 간행물인 Search Engine Land를 포함한 일부 전문가들은 Google이 선거(IsElectionAuthority) 및 코로나19 전염병(IsCovidLocalAuthority)과 관련된 검색을 포함하여 특정 주제에 대해 "허용 목록"을 구현하도록 제안하는 모듈을 언급하는 문서에 주목했습니다.
King은 이러한 참조가 특정 주제에 대한 "품질 소스"를 식별하려는 Google의 시도일 가능성이 높다고 말했습니다.
화이트리스트가 어떻게 작동하는지에 대한 세부 정보는 부족하지만 Google은 수년 동안 좌파 편견을 드러냈다는 혐의에 직면해 있습니다. 미디어 회사인 AllSides의 최근 분석에 따르면 Google 뉴스 기사의 63%가 좌파 매체에서 나온 반면, 우파 매체에서는 6%만이 기사인 것으로 나타났습니다.
우파 감시단체 미디어리서치센터(Media Research Center)의 분석에 따르면 2008년 이후 온라인 검색 대기업에서 발생한 '선거 간섭' 혐의 사례가 41건에 달했습니다.
보고서는 한때 상원 법사위원회에서 "구글 검색 알고리즘에 의해 생성된 편향된 검색 결과"가 "최소 260만 표를 힐러리 클린턴에게로 돌렸다"고 증언한 로버트 엡스타인(Robert Epstein) 박사의 데이터를 인용했습니다.
삼
구글은 해당 문서가 진짜임을 확인했다.게티 이미지를 통한 AFP
구글은 보수적 관점에 대한 편견을 오랫동안 부인해왔으며 엡스타인의 연구가 “광범위하게 사실이 아니다”라고 말했다.
유출된 검색 문서에는 Google이 The Post와 같은 뉴스 매체부터 중소기업 소유자에 이르기까지 웹사이트를 구성할 때 고려하는 14,000개 이상의 순위 요소가 포함되어 있는 것으로 알려졌습니다 .
내부 데이터는 지난 3월 온라인 코드 저장소 GitHub에 공개된 것으로 알려졌으나 검색 엔진 최적화(SEO) 전문가인 Rand Fishkin 과 King이 별도의 분석 내용을 입수하여 게시할 때까지 공개 조사를 받지 못했습니다 .
구글은 해당 문서가 진짜임을 암묵적으로 확인했다. 그러나 문서에는 중요한 맥락이 부족하고 검색 작동 방식에 대한 통찰력을 얻기 위해 대중이 사용해서는 안 된다고 경고했다.
구글 대변인 데이비스 톰슨(Davis Thompson)은 성명을 통해 “맥락을 벗어나거나 오래되었거나 불완전한 정보를 기반으로 검색에 대해 부정확한 가정을 하는 것에 대해 주의를 기울일 것”이라고 밝혔다.
성명서는 "우리는 검색이 작동하는 방식과 시스템이 평가하는 요소의 유형에 대한 광범위한 정보를 공유하는 동시에 결과의 무결성을 조작으로부터 보호하기 위해 노력했습니다"라고 덧붙였습니다.
삼
구글은 문서를 기반으로 결론을 내리는 것에 대해 경고했습니다.로이터
구글은 또한 해당 문서가 검색 순위 알고리즘에 대한 포괄적이거나 관련성이 높거나 최신의 관점이 아니라고 경고했습니다.
Google이 실제로 문서에 설명된 순위 요소를 구현했는지, 아니면 단순히 테스트 또는 실험을 했는지는 아직 확실하지 않습니다. 일부는 전혀 사용되지 않았을 수도 있습니다.
사용 중이더라도 사용자가 검색 결과에서 볼 수 있는 내용을 만드는 데 얼마나 중요한지 평가하는 것은 본질적으로 불가능합니다.
문서는 순위 기능에 가중치를 부여하는 방법을 밝히지 않았습니다.
저명한 SEO 전문가이자 웹 컨설팅 회사인 RustyBrick의 소유주인 Barry Schwartz에 따르면 유출된 문서는 검색에 대한 회사 내부 작업에 대한 흥미롭지만 불완전한 관점을 제공합니다.
13
어떻게 생각하나요? 가장 먼저 댓글을 남겨보세요.
슈워츠는 이 문서가 온라인 검색과 관련하여 "구글이 무엇을 생각하고 있는지"를 보여주는 신호로 가장 잘 보인다고 말했습니다.
Schwartz는 "링크, 콘텐츠 품질, 권위, 작성자와 같은 특정 요소를 중심으로 Google이 이를 수행하는 방법에는 모든 것이 포함되어 있습니다."라고 말했습니다. “문제는 가중치가 무엇인지, 이러한 신호가 얼마나 중요한지, 신호가 전혀 사용되는지를 모른다는 것입니다. 바로 이것이 문제이다.”
그럼에도 불구하고 King에 따르면 해당 문서는 "Google에서 검색을 통해 유출된 것 중 가장 큰 유출"에 해당합니다.
King은 “이것은 Google이 어떻게 작동하는지에 대해 지금까지 본 것 중 가장 크고 가장 투명한 것입니다.”라고 말했습니다.