주요 콘텐츠로 건너뛰기

18대, 19대 대선 데이터 & 분석 자료 공개

지역

18대, 19대 대선 데이터 & 분석 자료 공개

익명 (미확인) | 금, 2017/07/07- 18:33

K값 1.5 만든 후보 간 미분류율 차이… 지지성향과 투표자 연령대가 만들었다

영화 <더 플랜>, K값 1.5와 R제곱 0.98을 근거로 개표 조작 의혹 제기해

<더 플랜>은 18대 대선 개표에 사용된 투표지 분류기가 누군가에 의해 조작됐다는 의혹을 제기했다. 당시 투표지 분류기가 성공적으로 분류한 ‘분류표’에서의 각 후보 득표율이 분류를 보류한 ‘미분류표’에서의 득표율과 다르게 나타난 것이 부정 개표의 핵심적인 정황증거로 제시됐다. 이른바 전국 251개 선거구에서 구한 ‘K값’의 평균이 1.5라는 것이다.

2017070702_01

K값의 분자는 미분류표에서의 박근혜, 문재인 후보 득표 비율이고, 분모는 분류표에서의 두 후보 득표 비율이다. 즉, K값이 1보다 크다는 것은 미분류표에서는 박근혜 후보의 득표율이 높아졌고, 문재인 후보의 득표율은 낮아졌다는 것을 의미한다. 이 현상은 18대 대선 당시 전국 251개 개표구 대부분에서 일관되게 나타났다. <더플랜>은 이러한 규칙성을 사람이 개입한 인위적인 흔적이라고 설명한다.

<더플랜>은 분류표와 미분류표에서의 득표율 차가 얼마나 규칙적으로 나타나는지를 보여주기 위한 회귀분석 결과를 보여준다. 회귀분석은 어떠한 두 가지 변수 사이의 인과관계를 분석하는 데 사용되는 통계방법이다. <더플랜>이 보여준 단순회귀분석에서 종속변인은 K값의 분자인 미분류표에서의 득표율비, 독립변인은 K값의 분모인 분류표에서의 득표율비다.

[ 미분류표에서의 박근혜/문재인 득표비 ] = [ 분류표에서의 박근혜/문재인 득표비 ] X 1.5

이 회귀모형에 따르면 분류표에서의 득표비에 1.5를 곱하면 미분류표에서의 득표비를 예측할 수 있다. 분석 결과 회귀모형의 설명력을 의미하는 R제곱이 0.98로 매우 높게 나타났다. <더 플랜>은 이 수치가 사람이 개입한 확실한 증거라고 주장한다.

▲영화 <더플랜>중 회귀분석 설명 장면

▲영화 <더플랜>중 회귀분석 설명 장면

후보간 미분류율 차이, 지지성향과 투표자 연령대로 상당부분 설명돼

K값은 박근혜 후보의 미분류율을 문재인 후보의 미분류율로 나눈 값과 사실상 같은 값이다. 예를 들어, 두 후보의 미분류율이 같다면, 분류표에서의 두 후보 득표율비가 미분류표에서도 그대로 유지되어 K값은 1이 된다. 박 후보의 미분류율이 더 높으면 K값은 1보다 커지고, 문 후보의 미분류율이 더 높으면 반대로 K값이 1보다 작아진다. 18대 대선에서 박근혜 후보의 미분류율 3.67%를 문재인 후보의 미분류율 2.67%로 나누면 1.38이 나온다. 이 값은 전국 단위에서 K값을 계산한 결과인 1.39와 거의 같다.

고려대 통계학과 박유성 교수, 고려대 공공정책대학 최보승 교수, 경기대 경영학과 이동희 교수에게 분석을 의뢰했다.

그 결과 두 후보의 미분류율 차이(박 후보 미분류율 – 문 후보 미분류율)가 선거구의 지지성향(박근혜 득표율/문재인 득표율)과 투표자 연령대(투표자 중 특정 연령대의 점유율)로 상당 부분 설명된다는 것을 확인했다. 특정 연령대 투표자의 점유율 데이터는 선관위에서 전체 투표자 10%에 대해서 표본조사하는 18대 대선 투표율 분석 자료를 사용했다.

2017070702_03

미분류율이 높은 곳에서는 미분류율의 차이도 높게 나타났다. 따라서 선거구마다 서로 다른 미분류율 수준을 통제하기 위해 회귀분석에 미분류율을 포함했다. 독립변인인 지지성향과 60대 이상 투표자의 점유율은 미분류율을 통제한 상태에서도 (T검정의 유의확률이 0.05 이하로 나타나) 모두 유의미한 것으로 나타났다. 즉, 박근혜 후보를 더 지지하는 성향이 강할수록, 그리고 투표자 중 60대 이상 투표자의 점유율이 높을수록 두 후보 간 미분류율 차가 커지는 인과관계가 확인된 것이다. 20~30대 투표자 점유율이 높아지면 미분류율 차가 작아지는 관계도 확인됐다. 그러나 20~30대 비율은 60대 이상 비율과 -0.9 이상의 강한 상관관계를 보여 사실상 같은 변수(다중공선성 존재)로 보고 분석에서 제외했다. 이 밖에 40대 비율이나 50대 비율은 유의하지 않은 것으로 확인돼 마찬가지로 분석에서 제외했다.

2017070702_04

미분류율의 차이를 종속변인으로 제안한 고려대 통계학과 박유성 교수는 분석 결과 “보수가 미분류율을 높게 하는 경향이 있고, 이러한 가설이 꽤 설명력이 있다”고 말했다. 박 교수는 이러한 현상이 18대 대선뿐만 아니라 19대 대선에서도 반복됐다고 설명했다. 다른 통계학자도 비슷한 분석을 내놓았다. 고려대 공공정책대학 최보승 교수는 “한 지역에서 60대의 투표비율이 높아지면 높아질수록 박근혜의 미분류율이 문재인의 미분류율보다 더 많이 커진다”고 분석 결과를 설명했다.

한편, <더플랜> 측이 내놓은 R제곱 값 0.98에 대해 통계학자들은 그 수치를 있는 그대로 받아들이기 어렵다는 해석을 내놓았다. 회귀분석은 독립변인과 종속변인 사이의 인과관계를 분석하는 방법인데, <더플랜> 분석에서 사용한 독립변인(분류표에서의 박근혜/문재인 득표비)과 종속변인(미분류표에서의 박근혜/문재인 득표비) 사이의 인과관계를 확인할 수 없다는 것이다. 최보승 교수는 이 경우에는 R제곱이 높다고 해도 단순히 두 변인 사이에 강한 상관관계가 있을 뿐, 인과관계가 증명됐다고 보기 어렵다고 말했다.

박유성 교수도 <더플랜>이 회귀분석한 독립변인과 종속변인은 같은 추세로 움직이는 것이 당연한 데이터인데 인과관계를 분석한다는 것은 적절하지 않다고 말했다.

데이터 공개

뉴스타파는 분석한 내용을 투명하게 공개하려는 취지에서 이번 분석에 사용된 18대 대선 데이터와 19대 대선 데이터를 공개한다. 아래 링크에서 데이터를 다운받을 수 있다.

– 18대 대선 투표지 분류기 운영결과 – 회귀분석 데이터
– 19대 대선 투표지 분류기 운영결과 확인

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문
4·13 총선 서울 송파병에 출마한 새누리당 김을동 후보의 아들인 '삼둥이' 아빠 탤런트 송일국 씨가 1일 서울 송파구 거여동 거리에서 주민들과 인사하며 지지를 호소하고 있다. 2016.4.1 [email protected] <저작권자(c)...
금, 2016/04/01- 15:00
2
0
연기자 송일국이 5일 오후 서울 송파구 지하철 개롱역에서 어머니인 김을동 새누리당 국회의원 후보(송파병) 지원유세를 하고 있다. 2016.4.5/뉴스1 [email protected] [ⓒ 뉴스1코리아(news1.kr), 무단 전재 및 재배포...
화, 2016/04/05- 19:55
2
0
강서갑·을·병 후보들을 지원했다. 오후에는 마포갑·성북갑·성북을·강북갑·도봉갑·노원병·노원을·노원갑... 안 대표는 이날 자신의 지역구인 서울 노원병에서 출근길 홍보를 했으며, 이후에는 서울 강동·송파구와 경기...
목, 2016/04/07- 15:39
2
0

여야는 국회의원 이해충돌방지법 즉각 입법하라!

– 국회의원 지위 활용한 사익 추구 가능성, 촘촘히 방지해야

21일, 더불어민주당 정치개혁 TF는 국회의원의 이해충돌을 막기 위한 국회법 개정안을 발의했다. 개정안에는 상임위원의 사적 이해관계 직무수행 금지를 비롯한 이해충돌 방지 규정이 있어, 상임위원회에서 국회의원들이 사적 이익을 추구하는 행위를 선제적으로 방지할 수 있도록 하고 있다. <경실련>은 박덕흠, 윤창현, 전봉민 의원의 이해충돌 문제가 심각하게 드러난 만큼 여야가 국회의원 이해충돌방지법을 즉각 처리할 것을 촉구한다.

최근 일부 국회의원들이 자신의 상임위원회 지위를 활용해서 사적 이익을 추구하거나 부당한 영향력을 행사하는 이해충돌 논란이 끊이지 않고 있다. 지난 5년간 국토교통위원회 위원으로 활동했던 박덕흠 의원이 자신의 가족이 운영하는 회사들을 통해 피감기관으로부터 수백원에 이르는 공사계약을 수주한 의혹부터 시작해, 정무위원회 소속인 윤창현 의원이 삼성물산-제일모직 합병 당시 삼성물산 사외이사를 지낸 사실로부터 삼성 관련 사안을 다루는 것에 대한 논란이 제기됐다. 최근에는 전봉민 의원이 아버지 건설회사를 통해 도급공사와 아파트 분양사업을 넘겨받은 의혹도 제기되었다.

이렇듯 이해충돌 문제가 심각한 사회적 문제로 대두된 만큼, 21대 국회에서는 국회의원 이해충돌방지법을 즉각 입법해야 한다. 헌법 제46조는 국회의원의 청렴의 의무와 지위를 남용한 이익취득 금지 의무를 규정함으로써 헌법적 근거를 제공하고 있음에도, 국회의원의 이해충돌을 막을 수 있는 적극적인 제도의 부재로 인해 국회의원의 이해충돌 문제가 계속되고 있다.

현재 발의된 더불어민주당의 개정안은 상임위원의 사적 이해관계 직무수행 금지, 상임위 결격사유 신설, 안건심사 시 위원의 제척 회피제도 신설, 국회의원 민간부문 업무활동 내역 제출 및 공개, 의원과 공공기관 및 지역구 지자체와의 계약 제한, 주식 매각 백지신탁 대상 위원의 심사 표결 제한 등의 내용을 담고 있어 더 이상 국회의원이 그 지위를 남용해 사익을 추구할 수 없도록 해놓고 있다. 국회의원 이해충돌방지법이 통과된다면, 국회의원이 그 지위를 남용해 자신의 사익을 추구한다거나, 혹은 기존의 재산상의 권리로 인해 생길 수 있는 소모적인 이해충돌 논란을 겪지 않아도 될 것이다.

현재 국회에는 민주당의 국회의원 이해충돌방지법 이외에도 공직자 이해충돌방지법이 발의되어 있지만, 직무의 범위가 광범위한 국회의원에 공직자 이해충돌방지법을 그대로 적용시키는 것을 두고 논란이 있었다. 이런 상태에서 더불어민주당의 국회의원 이해충돌방지법은 국회의 특성을 반영하여 이러한 불필요한 논란에서 벗어날 수 있게 했다.

현재 국회의원의 이해충돌 의혹으로 국민들의 국회 불신이 심각한 상태이다. 특히, 국회의원의 경우 다른 공직자에 비하여 막강한 입법적 권한을 가지고 있으므로 국회의원 이해충돌방지법 도입이 시급한 실정이다. 여야는 국회의원의 이해충돌 논란을 불식시키기 위해 정치적 구호로 끝낼 것이 아니라, 21대 국회에서 반드시 이해충돌방지법을 통과시켜 국민의 신뢰를 회복해야 할 것이다. 아울러 2013년부터 공직자 이해충돌방지법이 제안됐지만 아직도 제정되지 못하고 있다. 이해충돌을 사전에 예방하기 위해서는 공직자의 사적이해관계 등록 의무와 처벌 규정을 강화한 법제정이 필요하다. 국회는 국회의원 이해충돌방지법과 함께 공직자 이해충돌방지법도 통과시켜야 한다.“끝”.

2020년 12월 23일

경제정의실천시민연합

수, 2020/12/23- 19:50
2
0