정치2014. 6. 4. 11:23


오늘 6.4지방선거 투표가 시작됩니다. 아침 6시부터 저녁 6시까지 진행되는 투표는 저녁 11시가 넘으면 당선자가 누구인지 알 수 있을 듯합니다.

아이엠피터는 내일쯤 구글 검색으로 지방선거를 예측했던 자료를 올리려고 했습니다. 그런데 6월 4일 투표 당일인 오늘 아침, 일부 조간신문 초판에서 '6.4지방선거 여야 판세'기사를 내보냈습니다.

그래서 아이엠피터도 준비하고 있던  구글 검색으로 본 광역단체장의 판세 분석 자료를 오늘 올리기로 했습니다.


구글 검색을 통한 판세 분석은 간단합니다. 후보자를 검색창에 넣고, 검색 결과의 숫자가 누가 더 많은지를 보는 방식입니다. 이 방식은 몇 가지 특징과 오류가 있습니다. 

1) 검색 결과는 단지 숫자만 보여줄 뿐이다.
2) 동명이인이 있을 경우 검색 숫자가 합산되어 나온다
3) 선거 기간이 아닌 그동안의 검색 누적 합산이다. 

이런 특징과 오류가 있음에도 구글 검색을 선택한 이유는 아이엠피터가 최대한 수집할 수 있는 데이터가 구글뿐이기 때문입니다.

언론사나 정치연구소, 리서치 기관은 막대한 자본과 인력을 동원해서 엄청난 데이터를 수집해서 예측할 수 있겠지만, 아이엠피터는 노트북 한 대로 모을 수 있는 데이터가 구글 검색 데이터이외에는 없습니다.


단순한 구글 검색 결과라고 무의미한 숫자는 아닙니다. 지난 2007년 대선 때 이명박 후보의 검색 결과 페이지가 1천만 개였는데 득표수가 1천만 표가 나왔다는 사실 (정동영 후보는 5백만, 득표수도 비슷)을 보면 쉽게 이해가 될 것입니다.

한국 여론조사가 실제 선거 결과와 다른 경우와 비교하면 오히려 구글 검색이 정확했던 사례도 있습니다.

2010년 서울시장 선거에서 여론은 한명숙 후보가 오세훈 후보와 비교해서 반 이상 낮은 지지를 받고 있다는 결과를 내보냈습니다. 그러나 구글은 실제 투표일에 가까울수록 한명숙 후보에 대한 검색 결과가 늘어났다고 보여줬습니다.

실제 선거결과 한명숙 후보와 오세훈 후보와의 차이는 불과 1% 미만이었습니다.


' 서울시장: 박원순 VS 정몽준'

박원순 후보와 정몽준 후보가 경합을 벌이고 있는 서울시장 선거는 6.4지방선거의 최대 관심사입니다.

서울시가 광역 단체 중에서 가장 많은 유권자 수를 갖고 있으며, 여,야 선거 승리의 상징성도 포함하고 있기 때문입니다.


'구글트렌드'로 정몽준 후보와 박원순 후보를 검색한 결과 2014년 5월은 비슷하다가 2014년 6월은 박원순 후보가 더 많은 관심도를 나타낸 것으로 나왔습니다.

박원순 후보의 관심도가 높아진 이유는 '농약급식' 등의 공세가 거세지면서 많은 시민들이 관심을 가졌기 때문입니다.


구글 트렌드가 아닌 직접 검색어 입력 방식으로 나온 검색 결과 페이지를 보면 박원순 후보가 11,500.000 페이지였고, 정몽준 후보는 10,200,000 페이지였습니다.

두 후보의 검색 페이지만으로는 박원순 후보가 '우세'로 나옵니다. 그러나 검색 결과에 나온 페이지 모두가 박원순 후보에게 호의적인지 아닌지를 분석하기 어렵기 때문에 정확한 분석은 아직까지 어렵습니다.

그러나 구글 검색에서만큼은 박원순 후보에 대한 관심도가 정몽준 후보보다 높다고 나오고 있습니다.

' 전국 광역단체장의 구글 검색 결과'

이번 지방선거는 광역단체장을 비롯해 수백 명의 기초의회 의원, 구청장,교육의원, 교육감 등을 선출합니다.

이 모든 사람을 아이엠피터가 검색해서 결과를 내기는 어렵기 때문에 전국 광역단체장 17곳만 검색해봤습니다.

구글 검색으로 나온 결과를 보면 다음과 같습니다.

■ 새누리당 우세: 경기, 제주,경남,경북
■ 새정치민주연합 우세:서울,인천,세종,충남,충북,전북,전남,강원,대구

■ 무소속:부산,광주
■ 경합:대전


이 중에서 대구시장은 구글 검색 결과와 언론의 예측이 다릅니다. 또한 광주시장의 경우 새누리당 이정재 후보와 동일한 이름의 검색 결과가 너무 많았습니다. (광주시장의 경우, 새누리당,새정치민주연합, 무소속 강운태 후보를 모두 포함해서 검색했습니다.)  


동명이인이 많아 제외한 검색에는 울산시장 새누리당 김기현 후보와 정의당 조승수 후보가 있습니다. 이 두 사람은 모두 동명이인에 대한 검색 결과가 많이 포함되어 있었고
검색 결과의 숫자도 비슷했습니다.

원래 데이터 검색 결과에 나온 숫자를 조금 더 분석해야 할 필요성은 있지만, 그 부분은 선거 후로 미루도록 하겠습니다.

'서울시 교육감, 너무 관심이 없었다'

서울시장 선거 다음으로 관심을 받는 선거가 서울시 교육감입니다. 정몽준 후보의 '농약급식' 공세와 고승덕 후보의 딸이 올린 페이스북 글로 많은 이목을 받고 있습니다.


서울시 교육감 검색 결과를 보면 의외의 결과가 나왔습니다. 고승덕 후보가 6,930,000 페이지로 월등히 앞서고 있지만, 다른 후보에 비해 인지도가 떨어졌던 조희연 후보가 문용린 후보와 비슷하다는 결과가 나오고 있습니다.

서울시 교육감 검색 결과의 특징을 보면 선거 전에는 그다지 관심이 없었다는 점입니다.

이번 서울시교육감 선거에 출마한 후보들은 별로 주목을 받지 못하다가 지방선거를 계기로 사람들의 관심을 받기 시작했습니다.


고승덕 후보는 다른 후보와 비교하면 인지도가 높았습니다. 높은 인지도와 함께 선거과정에서 불거진 가족사로 검색 조회와 페이지가 많아졌습니다.

조희연 후보와 문용린 후보를 보면 고승덕 후보에 비해 낮지만, 선거를 계기로 관심도가 꾸준히 높아졌습니다.


우리가 서울시 교육감 후보 검색 결과를 통해 알 수 있는 것은 우리 아이들의 미래와 교육을 책임지는 교육감 선거인데도 불구하고 너무 관심이 적었다는 부분입니다.

아이엠피터 개인적인 생각으로는 교육감과 교육의원 선거는 별도로 치러야 교육감을 선출하는 의미를 제대로 가질 수 있다고 봅니다.

KBS출구 조사 관련 이미지 때문에 선관위가 오전 7시에 올린 글을 블라인드 요청 처리됐습니다.
이 글은 문제가 됐던 관련 이미지를 삭제하고 다시 올린 글입니다.


KBS 웹페이지에 출구조사가 올라와서, 한때 소동이 벌어졌습니다. 일부에서는 KBS가 보수와 여당표를 결집하려고 일부러 유출한 것이 아니냐는 의혹도 제기하고 있습니다.

우리가 미래를 예측하는 것은 불가능하고 어렵습니다. 그러나 어느 정도 정보가 공개된다면 예측하기가 더 쉬워지고 확률도 높아집니다. 문제는 이런 정보는 항상 언론이 알려주기 전에는 모르거나, 언론의 원본 데이터를 과연 신뢰할 수 있느냐입니다.

아이엠피터는 온라인에 돌아다니는 후보자 관련 웹페이지를 모두 분석해서 정확한 예측을 해보고 싶지만, 한계를 느낍니다

다행히 개인이 자유롭게 얻을 수 있는 구글 검색 데이터가 있기에, 다른 정보와 교차 검증을 할 수 있는 토대는 갖출 수 있었습니다.


구글 검색이 완벽하거나 정확한 예측을 한다고 보기는 어렵습니다. 그러나 정치와 후보자에 대한 관심을 두고 정보를 많이 수집하고 검증할 수록, 정치인은 유권자를 무서워하게 됩니다. 

오늘 선거가 끝나면 돌변하는 후보자들이 분명 나옵니다.
투표는 최고의 선택을 하는 것이 아닙니다.
선거가 끝났다고 국민을 무시하는 최악의 정치인을 막는 안전벨트입니다.

나 하나 투표 안 한다고 무슨 일이 있겠느냐는 물음에 아이엠피터는 자신 있게 말합니다.
네, 분명 있습니다.

우리를 살릴 수도 죽일 수도 있는 투표, 지금 당장 하러 갑시다.

Posted by 아이엠피터

댓글을 달아 주세요

  1. 같은 포스팅이 2개가 있는것 같네요.

    2014.06.04 22:16 [ ADDR : EDIT/ DEL : REPLY ]
  2. 트랙백은 안돼서 링크로 관련글을 썼습니다. 좋은 글 잘봤습니다.

    구글 분석은 쓰면 쓸 수록 참 대단한 것 같아요...^^

    2014.06.05 15:13 신고 [ ADDR : EDIT/ DEL : REPLY ]
  3. 트랙백은 안돼서 링크로 관련글을 썼습니다. 좋은 글 잘봤습니다.

    구글 분석은 쓰면 쓸 수록 참 대단한 것 같아요...^^

    2014.06.05 15:13 신고 [ ADDR : EDIT/ DEL : REPLY ]