▲ 자유한국당 홍준표 후보의 서대전 유세. ⓒ뉴데일리 정상윤 기자
자유한국당 홍준표 후보가 〈구글트렌드〉등 빅데이터 관심도에서 더불어민주당 문재인 후보를 앞서가기 시작했다.
최근 여론조사에서 안철수 후보와 '실버크로스'를 이룬 것으로 나타난 가운데, 문재인 후보와의 '골든 크로스'도 나타날지 주목된다.
자유한국당 홍준표 후보는 2일 SNS를 통해 "미국 대선을 정확히 맞추었던 구글 트렌드는 오늘 아침 기준으로 제가 43, 문재인 31, 안철수 23"이라며 이같이 말했다.
홍 후보가 발언한 수치는 정확히 확인되지 않았지만, 2일 오전 6시를 기준 〈구글트렌드〉에서 홍준표 후보에 대한 관심도가 문재인 후보를 넘어선 것으로 집계했다.
구체적으로는 5자구도 비교 분석(대한민국, 지난 7일간, 오전 6시 기준 웹 검색)에서 홍 후보는 34, 문재인 후보는 31, 국민의당 안철수 후보는 17, 바른정당 유승민 후보는 13, 정의당 심상정 후보는 7이었다.
수치를 살펴보면, 홍 후보의 약진 외에도 안철수 후보의 관심도 하락과 유승민 후보의 상승이 눈에 띈다. 전날인 1일 오후부터 바른정당 소속 의원 14명의 탈당 움직임으로 국내 포털 실시간 검색어에 유승민 의원 등이 이름을 올린 것이 상당수 반영된 것으로 보인다. 때문에 시중의 여론조사보다 오히려 신뢰도가 높을 수도 있다는 게 각 선거캠프의 시각이다.
앞서 홍 후보는 줄곧 "여론조사를 신뢰하지 않는다"며 반박의 근거로 빅데이터를 제시한 바 있다. 지난달 27일에도 "구글 트렌드 빅데이터는 제가 압도적"이라며 "관심도를 지지도로 연결시키는 작업만 남았다"고 했다.
▲ 구글 트렌드에 따르면, 자유한국당 홍준표 후보는 관심도에서 4월 25일을 기준으로 안철수 후보를 제친 데 이어, 2일 오전을 기준으로 문재인 후보의 관심도를 넘어섰다. ⓒ구글트렌드 제공
구글트렌드의 관심도 지수는 웹 검색량을 기준으로 일정 기간동안 가장 높은 검색량을 기록한 사람을 100으로 했을때의 상대값이다. 구글 등을 통해 실시간 반응을 집계할 수 있기 때문에 하루 이상 시간이 소요되는 여론조사보다 민심의 동향을 더 빨리 읽어낼 수 있다는 특징이 있다.
정확성에서도 미국 대선을 정확히 맞춘것으로 한 차례 검증된 바 있다. 지난 미국 대선에서 대부분의 여론조사 기관들은 힐러리 후보의 당선을 예측했지만, 구글 트렌드의 빅데이터는 트럼프 후보에 대한 관심도 가 더 높은 것으로 집계한 바 있었다.
이같은 특징을 바탕으로 본다면, 빅데이터가 남은 선거기간 동안 민심을 읽는 지표가 될 것이라는 전망이 나온다. 오는 3일부터 '밴드왜건 효과'를 방지하기 위한 차원에서 여론조사결과 공표가 금지되기 때문이다.
홍 후보의 이같은 상승세에 대해 한 자유한국당 관계자는 "정세균 국회의장도 20대 총선을 앞두고 여론조사를 믿지 않는다 했다"며 "최근 여론조사가 나름대로 자유한국당에 고무적인 결과라는 평가도 있지만, 현장 분위기는 더 좋다"고 자신감을 피력했다.
/ 출처:Copyright ⓒ Newdaily All rights reserved.
빅데이터가 어떤 식으로 실생활에 이용될 수 있는지 명쾌하게 보여준 것이 구글 검색 빈도를 통한 독감 발병 예측이다. 구글은 사람들이 독감에 걸렸을 때 온라인에서 검색하는 대표적인 키워드 40개를 뽑은 뒤 검색 빈도를 추적해 독감 발병을 예측하는 ‘독감 트렌드’ 서비스를 2008년 개발했다. 과학전문지 네이처는 이듬해 구글 검색에서 독감과 관련된 질문의 빈도와 독감에 걸린 환자들이 병원을 찾는 빈도 사이에 상관관계가 있다는 논문을 실었다.
▷지난해 미국 대선의 승자는 빅데이터라는 말이 있다. 미국 주요 언론들이 대부분 힐러리 클린턴의 승리를 예측한 가운데 소셜네트워크서비스(SNS), 인터넷, 모바일 검색량을 토대로 도널트 트럼프의 승리를 예측한 수치가 실제 결과와 가장 비슷한 것으로 나왔기 때문이다. 빅데이터 분석은 각종 여론조사의 예측을 빗나가게 하는 ‘샤이(shy) 유권자’의 표심까지 읽을 수 있는 수단으로도 여겨지고 있다.
▷빅데이터 분석에 가장 쉽게 이용되는 것이 구글 트렌드다. 문재인 더불어민주당 대선 후보 측은 그제 ‘구글 트렌드 검색량에서 안철수 국민의당 후보가 문 후보를 앞선다’는 안 후보 측의 주장은 거짓이라고 반박했다. 안 후보가 지난달 4∼18일 문 후보를 앞선 것은 사실이지만 18일 이후부터는 다시 문 후보가 앞섰다는 것이다. 홍준표 자유한국당 후보도 어제 질 수 없다며 가세했다. 이달 들어 문재인과 홍준표가 거의 같은 수준으로 나오고 있다는 것이다.
▷3일부터 여론조사 결과는 선거가 끝날 때까지 공표되지 않는다. 아쉬운 대로 구글 트렌드라도 이용해볼 수밖에 없다. 선거관리위원회에선 빅데이터 조사가 여론조사에 해당하지 않아 공표에 제한이 없지만 왜곡 가능성이 있다며 주의를 당부했다. 그러나 구글 트렌드는 여론조사와 달리 누구라도 직접 확인할 수 있다. ‘문재인’을 치고 비교란에서 안철수나 홍준표를 차례로 입력해 보라. 비교 수치를 한눈에 볼 수 있는 그래프가 뜬다. 다만 한국인은 구글 검색을 많이 하지 않아 정확도는 영어권 검색보다 떨어질 수 있다는 점을 감안해야 한다.
/ 동아일보 송평인 논설위원 pisong@donga.com