주요 콘텐츠로 건너뛰기

18대, 19대 대선 데이터 & 분석 자료 공개

지역

18대, 19대 대선 데이터 & 분석 자료 공개

익명 (미확인) | 금, 2017/07/07- 18:33

K값 1.5 만든 후보 간 미분류율 차이… 지지성향과 투표자 연령대가 만들었다

영화 <더 플랜>, K값 1.5와 R제곱 0.98을 근거로 개표 조작 의혹 제기해

<더 플랜>은 18대 대선 개표에 사용된 투표지 분류기가 누군가에 의해 조작됐다는 의혹을 제기했다. 당시 투표지 분류기가 성공적으로 분류한 ‘분류표’에서의 각 후보 득표율이 분류를 보류한 ‘미분류표’에서의 득표율과 다르게 나타난 것이 부정 개표의 핵심적인 정황증거로 제시됐다. 이른바 전국 251개 선거구에서 구한 ‘K값’의 평균이 1.5라는 것이다.

2017070702_01

K값의 분자는 미분류표에서의 박근혜, 문재인 후보 득표 비율이고, 분모는 분류표에서의 두 후보 득표 비율이다. 즉, K값이 1보다 크다는 것은 미분류표에서는 박근혜 후보의 득표율이 높아졌고, 문재인 후보의 득표율은 낮아졌다는 것을 의미한다. 이 현상은 18대 대선 당시 전국 251개 개표구 대부분에서 일관되게 나타났다. <더플랜>은 이러한 규칙성을 사람이 개입한 인위적인 흔적이라고 설명한다.

<더플랜>은 분류표와 미분류표에서의 득표율 차가 얼마나 규칙적으로 나타나는지를 보여주기 위한 회귀분석 결과를 보여준다. 회귀분석은 어떠한 두 가지 변수 사이의 인과관계를 분석하는 데 사용되는 통계방법이다. <더플랜>이 보여준 단순회귀분석에서 종속변인은 K값의 분자인 미분류표에서의 득표율비, 독립변인은 K값의 분모인 분류표에서의 득표율비다.

[ 미분류표에서의 박근혜/문재인 득표비 ] = [ 분류표에서의 박근혜/문재인 득표비 ] X 1.5

이 회귀모형에 따르면 분류표에서의 득표비에 1.5를 곱하면 미분류표에서의 득표비를 예측할 수 있다. 분석 결과 회귀모형의 설명력을 의미하는 R제곱이 0.98로 매우 높게 나타났다. <더 플랜>은 이 수치가 사람이 개입한 확실한 증거라고 주장한다.

▲영화 <더플랜>중 회귀분석 설명 장면

▲영화 <더플랜>중 회귀분석 설명 장면

후보간 미분류율 차이, 지지성향과 투표자 연령대로 상당부분 설명돼

K값은 박근혜 후보의 미분류율을 문재인 후보의 미분류율로 나눈 값과 사실상 같은 값이다. 예를 들어, 두 후보의 미분류율이 같다면, 분류표에서의 두 후보 득표율비가 미분류표에서도 그대로 유지되어 K값은 1이 된다. 박 후보의 미분류율이 더 높으면 K값은 1보다 커지고, 문 후보의 미분류율이 더 높으면 반대로 K값이 1보다 작아진다. 18대 대선에서 박근혜 후보의 미분류율 3.67%를 문재인 후보의 미분류율 2.67%로 나누면 1.38이 나온다. 이 값은 전국 단위에서 K값을 계산한 결과인 1.39와 거의 같다.

고려대 통계학과 박유성 교수, 고려대 공공정책대학 최보승 교수, 경기대 경영학과 이동희 교수에게 분석을 의뢰했다.

그 결과 두 후보의 미분류율 차이(박 후보 미분류율 – 문 후보 미분류율)가 선거구의 지지성향(박근혜 득표율/문재인 득표율)과 투표자 연령대(투표자 중 특정 연령대의 점유율)로 상당 부분 설명된다는 것을 확인했다. 특정 연령대 투표자의 점유율 데이터는 선관위에서 전체 투표자 10%에 대해서 표본조사하는 18대 대선 투표율 분석 자료를 사용했다.

2017070702_03

미분류율이 높은 곳에서는 미분류율의 차이도 높게 나타났다. 따라서 선거구마다 서로 다른 미분류율 수준을 통제하기 위해 회귀분석에 미분류율을 포함했다. 독립변인인 지지성향과 60대 이상 투표자의 점유율은 미분류율을 통제한 상태에서도 (T검정의 유의확률이 0.05 이하로 나타나) 모두 유의미한 것으로 나타났다. 즉, 박근혜 후보를 더 지지하는 성향이 강할수록, 그리고 투표자 중 60대 이상 투표자의 점유율이 높을수록 두 후보 간 미분류율 차가 커지는 인과관계가 확인된 것이다. 20~30대 투표자 점유율이 높아지면 미분류율 차가 작아지는 관계도 확인됐다. 그러나 20~30대 비율은 60대 이상 비율과 -0.9 이상의 강한 상관관계를 보여 사실상 같은 변수(다중공선성 존재)로 보고 분석에서 제외했다. 이 밖에 40대 비율이나 50대 비율은 유의하지 않은 것으로 확인돼 마찬가지로 분석에서 제외했다.

2017070702_04

미분류율의 차이를 종속변인으로 제안한 고려대 통계학과 박유성 교수는 분석 결과 “보수가 미분류율을 높게 하는 경향이 있고, 이러한 가설이 꽤 설명력이 있다”고 말했다. 박 교수는 이러한 현상이 18대 대선뿐만 아니라 19대 대선에서도 반복됐다고 설명했다. 다른 통계학자도 비슷한 분석을 내놓았다. 고려대 공공정책대학 최보승 교수는 “한 지역에서 60대의 투표비율이 높아지면 높아질수록 박근혜의 미분류율이 문재인의 미분류율보다 더 많이 커진다”고 분석 결과를 설명했다.

한편, <더플랜> 측이 내놓은 R제곱 값 0.98에 대해 통계학자들은 그 수치를 있는 그대로 받아들이기 어렵다는 해석을 내놓았다. 회귀분석은 독립변인과 종속변인 사이의 인과관계를 분석하는 방법인데, <더플랜> 분석에서 사용한 독립변인(분류표에서의 박근혜/문재인 득표비)과 종속변인(미분류표에서의 박근혜/문재인 득표비) 사이의 인과관계를 확인할 수 없다는 것이다. 최보승 교수는 이 경우에는 R제곱이 높다고 해도 단순히 두 변인 사이에 강한 상관관계가 있을 뿐, 인과관계가 증명됐다고 보기 어렵다고 말했다.

박유성 교수도 <더플랜>이 회귀분석한 독립변인과 종속변인은 같은 추세로 움직이는 것이 당연한 데이터인데 인과관계를 분석한다는 것은 적절하지 않다고 말했다.

데이터 공개

뉴스타파는 분석한 내용을 투명하게 공개하려는 취지에서 이번 분석에 사용된 18대 대선 데이터와 19대 대선 데이터를 공개한다. 아래 링크에서 데이터를 다운받을 수 있다.

– 18대 대선 투표지 분류기 운영결과 – 회귀분석 데이터
– 19대 대선 투표지 분류기 운영결과 확인

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문
ⓒ 남소연 5월 30일, 서울 송파구 삼전동에 위치한 최재성 캠프 사무실. 최재성 : "아니 어머니들이 찾아오셨는데 후보가 나가보라고 할 때까지 멀뚱히 서 있는 게 말이 돼요? 저분들이 이 날씨에 찾아왔다가 그냥 돌아가면 기분이...
토, 2018/06/09- 11:16
4
0
병적제적자가 가장 많은 지역은 서울로서 총 1843명으로 35.3%를 차지했다. 특히 강남 3구라고 불리는 강남·서초·송파구에 집중된 것으로 드러났다. 전국 시·군·구·별로는 강남구가 총 188명으로 1위를 차지했고 서초구...
화, 2018/10/30- 09:45
4
0

민의를 반영하는 연동형 비례대표제 도입과 의원 정수 확대

– 570여개 시민단체 정치개혁공동행동
선거제도 개혁 촉구 기자회견 개최-

 

  1. 오늘(11/15) 오후 1시 30분, 전국 570여개 시민사회단체로 구성된 정치개혁공동행동은 국회 정론관에서 민의를 왜곡하는 현재의 선거제도를 바꾸기 위해 연동형 비례대표제 도입과 의원정수 확대를 중심으로 한 선거제도 개혁이 필요하다며, 국회 정치개혁특별위원회(이하 정개특위)가 이에 대해 책임감 있게 논의에 나설 것을 촉구하는 기자회견을 진행하였습니다.

 

  1. 정치개혁공동행동은 만연해 있는 국회에 대한 냉소와 혐오를 바꾸기 위해서는 민의를 제대로 반영하지 못하고 있는 현행 선거제도를 시급히 바꾸어야 한다고 강조했습니다. 지난 20대 총선에서만 50.3%의 사표가 발생했고, 득표에 비례하지 않게 의석을 배분하는 선거제도로는 민의를 제대로 반영할 수 없다는 것입니다. 이미 국회 정개특위에서도 비례성과 대표성을 강화하는 연동형 비례대표제 도입에 대한 공감대가 있는 만큼 조속히 이에 대한 합의를 도출해내야 한다고 주장했습니다. 또한 정치개혁공동행동은 연동형 비례대표제가 제대로 작동하기 위해서는 의원정수 확대가 불가피하다며, 거대 양당이 국민 여론을 핑계로 의원 수를 유지하면서 종전의 기득권에 안주하려 해서는 안 된다고 지적했습니다. 의원들 스스로 자신들이 누리는 특권을 내려 놓고 일하는 의원들을 더 많이 뽑을 수 있도록 의원 정수 확대 논의에 나서야 한다는 것입니다.

 

  1. 정치개혁공동행동은 내년 선거구 획정과 2020년 총선을 앞두고 있는 지금이 선거제도를 개혁할 적기라며, 이를 위해 정개특위를 밀착 모니터하고, 전국 서명캠페인과 국회를 압박할 직접행동과 같은 다양한 활동을 전개해 나갈 것이라고 밝혔습니다. 오늘 기자회견에는 민주사회를 위한 변호사모임 김호철 회장, 참여연대 정강자 공동대표, 한국여성단체연합 김영순 공동대표 및 정치개혁공동행동 소속 시민단체 대표 등이 참석하였습니다.<끝>.

목, 2018/11/15- 14:39
4
0
이명박 전 대통령이 6일 서울 송파구 동부구치소를 나오는 도중 차량 창문을 내리고 지지자들에게 손 인사를 하고 있다. 뇌물·횡령 등 혐의로 1심에서 징역 15년을 선고받은 이 전 대통령은 항소심에서 보석으로 풀려났다....
수, 2019/03/06- 15:43
4
0