대선 D-10, 트럼프 콕 찍었던 구글…한국 대선 예측은?
최근 한 달 분석해보니…구글에선 이재명, 네이버 검색에선 윤석열
전문가 "검색어, 긍정·부정 구분 안 돼 한계…초박빙일 땐 노출량 많은 후보 유리"
2022-02-27 14:47:50 2022-02-27 14:48:49
(왼쪽부터)이재명 민주당 후보와 윤석열 국민의힘 후보가 지난 25일 서울 마포구 상암동 SBS 스튜디오에서 열린 중앙선거관리위원회 주관 제20대 대통령선거 후보자 2차 정치분야 방송토론회에서 토론 준비를 하고 있다. (사진=연합뉴스)
 
[뉴스토마토 유승호 기자] 20대 대통령 선거일까지 10일 남은 가운데 빅데이터로 본 최근 한 달간 정치 관심도는 이재명 민주당 후보가 윤석열 국민의힘 후보보다 높았다. 각종 여론조사 결과 두 사람이 오차범위 내의 초접전을 이어가는 데다, 선거 직전 일주일 간 여론조사 공표가 금지되는 깜깜이 선거로 돌입하는 만큼 구글 트렌드 등 빅데이터의 예측이 얼마나 적중할지도 이번 대선의 또 다른 관심사다. 
 
27일 <뉴스토마토>는 구글 트렌드를 활용해 이재명 민주당 후보, 윤석열 국민의힘 후보, 안철수 국민의당 후보에 대한 최근 한 달(1월27일~2월24일) 동안의 여론 관심도 변화를 분석했다. 결과에 따르면 후보별로 최근 한 달간 '평균 관심도'는 이재명 67, 윤석열 47, 안철수 20이었다. 해당 지수는 검색 대상에 대한 대중적 관심도를 보여준다. 대상 기간 중 검색횟수가 가장 많았던 때를 100으로 정하고 시기별로 상대적 수치를 환산해 나타낸다.
 
구글 트렌드를 활용해 이재명 민주당 후보, 윤석열 국민의힘 후보, 안철수 국민의당 후보의 최근 한 달(1월27일~2월24일) 동안의 관심도 변화 추이. (사진=구글 트렌드 캡처)
 
구글 트렌드는 지난 2016년 미국 대선에서 힐러리 당선을 예측한 대부분의 여론조사 결과와 반대로 트럼프 당선을 예측하며 주목을 끌었다. 이후 구글 트렌드는 2016년 영국의 유럽연합(EU) 탈퇴를 예고했고 한국의 19대 대선, 4·7 서울시장 보궐선거 결과도 맞춰 정치권의 새로운 트렌드로 떠올랐다.
 
구글 트렌드로 지난달 17일과 이달 24일 지수를 비교하면 세 후보 모두 크게 상승한 가운데, 상대적으로 이 후보의 상승세가 컸다. 이 후보는 55에서 70으로, 윤 후보는 34에서 47로, 안 후보는 5에서 19로 각각 올랐다. 세 후보에 대한 관심도는 지수 크기 자체에서 차이가 났지만 등락 흐름은 비슷한 양상을 보였다. 다만 각 후보에 따른 특정 이슈가 있을 때 급격히 상승하거나 하락하는 양상도 나타났다. 특히 세 후보 모두 TV토론이 있던 날에는 모두 관심도가 올랐다.
 
구체적으로 이 후보의 경우 관심도가 큰 폭으로 오른 시점은 지난 2일과 21일이었다. 지난 2일에는 전날 62에서 90까지 증가했는데 이날은 김동연 새로운물결 후보와의 TV토론 이슈가 있었다. 이어 지난 21일에는 관심도 100을 달성했는데 민주당의 추경안 처리, 법정 2차 TV토론 이슈가 있었다. 윤 후보의 관심도 지수가 이 후보를 추월했을 때는 지난 12일과 13일이었다. 이 후보와 윤 후보의 검색량은 12일엔 각각 46 대 52였고, 13일엔 63 대 66이었다. 12일은 윤 후보가 정책 홍보열차인 ‘열정열차’를 처음으로 타고 유세에 나선 날이었으며 13일은 안 후보가 윤 후보에게 단일화를 제안한 시점이다. 이 때 안 후보의 관심도도 기존 11에서 58로 폭발적으로 늘었다.
 
같은 기간 각 후보의 관심도를 지역별로 보면 이 후보의 경우 광주, 전북, 울산, 전남, 인천 등이 높게 나타났고 윤 후보의 경우 경남, 강원, 경북, 대전, 충남 지역이 상위권을 기록했다. 안 후보의 경우 제주, 부산, 충북, 서울, 대구 등에서 상대적으로 관심도가 높은 것으로 나타났다.
 
이어 각 후보의 관련 검색어를 분석한 결과 이 후보와 윤 후보는 각자 상대 후보의 이름이 관련 검색어에 올랐다. 지지율 키워드도 관련 검색어 상위권을 차지했다. 안 후보의 경우 윤석열, 안철수 단일화, 단일화 등이 관련 검색어로 분석됐다. 이는 현재 여론조사 결과에서 나타나는 초접전 양상과 단일화 이슈를 그대로 반영한 것으로 해석된다.
 
네이버 데이터랩을 활용해 최근 한 달(1월26일~2월26일) 검색트렌드를 분석한 결과. (사진=네이버 데이터랩 캡처)
 
한편 네이버 데이터랩을 활용해 최근 한 달(1월26일~2월26일) 검색 트렌드를 분석한 결과는 달랐다. 윤 후보가 소폭 우위에 있는 것으로 조사됐다. 이 후보의 검색량 지수는 1월26일 34에서 이달 26일 52로 올랐고, 같은 기간 윤 후보는 33에서 59로 증가했다.
 
이외에도 트위터, 인스타그램 등 소셜네트워크서비스(SNS)에 게시된 데이터를 분석하는 썸트렌드를 활용해 최근 한 달(1월27일~2월26일) 동안의 각 후보 이름 언급량 추이를 비교한 결과에서는 이 후보가 352만9203개, 윤 후보가 284만5979개로 분석됐다.
 
트위터, 인스타그램 등 소셜네트워크서비스(SNS)에 게시된 데이터를 분석하는 썸트렌드를 활용해 최근 한 달(1월27일~2월26일) 동안의 각 후보 이름 언급량 추이를 비교한 결과. (사진=썸트렌드 캡처)
 
일각에서는 구글 트렌드 등 검색량 분석으로 여론조사 수준까지 결과를 예측하는 것은 무리가 있어 참고만 해야 한다는 지적도 나온다. 검색하는 정보가 긍정, 부정으로 구분되지 않고 전체 검색량만을 가지고 수치를 집계하기 때문이다. 특정 후보에 대한 부정적인 이슈가 발생했을 때가 대표적인 사례다. 다만 초박빙 상황에서는 검색 노출량이 많은 후보가 이길 확률이 높다는 게 전문가들의 평가다.
 
홍형식 한길리서치소장은 “구글 트렌드에 참여하는 사람들은 인터넷, SNS에 노출된 사람들의 활동량이기 때문에 전 국민의 비율하고는 다르고 노출량이 많더라도 긍정, 부정 중 어느 쪽이 많은지 판단을 해야 된다”면서 “일반 정치·사회 여론조사의 표본 대표성에는 한계가 있다”고 지적했다. 그러면서도 “전국민 여론조사에서 현재와 같은 백중 상황일 때에는 ‘누가 이길 것인가’라는 것을 검토할 때 구글 트렌드에서 노출량이 많은 후보가 이길 확률이 높다”고 했다.
 
김능구 e윈컴 대표 역시 “여론조사로는 오차 범위 내, 뿐만 아니라 지금 1% 이내에서 붙기 때문에 모른다”면서 “지금처럼 박빙일 때에는 ‘과연 뒷심이 누가 더 높은지’를 볼 때 구글 트렌드를 보면 굉장히 참고가 된다”고 설명했다.
 
유승호 기자 peter@etomato.com
이 기사는 뉴스토마토 보도준칙 및 윤리강령에 따라 김기성 편집국장이 최종 확인·수정했습니다.

ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지

관련기사
0/300

뉴스리듬

    이 시간 주요 뉴스

      함께 볼만한 뉴스