주요 콘텐츠로 건너뛰기

18대, 19대 대선 데이터 & 분석 자료 공개

지역

18대, 19대 대선 데이터 & 분석 자료 공개

익명 (미확인) | 금, 2017/07/07- 18:33

K값 1.5 만든 후보 간 미분류율 차이… 지지성향과 투표자 연령대가 만들었다

영화 <더 플랜>, K값 1.5와 R제곱 0.98을 근거로 개표 조작 의혹 제기해

<더 플랜>은 18대 대선 개표에 사용된 투표지 분류기가 누군가에 의해 조작됐다는 의혹을 제기했다. 당시 투표지 분류기가 성공적으로 분류한 ‘분류표’에서의 각 후보 득표율이 분류를 보류한 ‘미분류표’에서의 득표율과 다르게 나타난 것이 부정 개표의 핵심적인 정황증거로 제시됐다. 이른바 전국 251개 선거구에서 구한 ‘K값’의 평균이 1.5라는 것이다.

2017070702_01

K값의 분자는 미분류표에서의 박근혜, 문재인 후보 득표 비율이고, 분모는 분류표에서의 두 후보 득표 비율이다. 즉, K값이 1보다 크다는 것은 미분류표에서는 박근혜 후보의 득표율이 높아졌고, 문재인 후보의 득표율은 낮아졌다는 것을 의미한다. 이 현상은 18대 대선 당시 전국 251개 개표구 대부분에서 일관되게 나타났다. <더플랜>은 이러한 규칙성을 사람이 개입한 인위적인 흔적이라고 설명한다.

<더플랜>은 분류표와 미분류표에서의 득표율 차가 얼마나 규칙적으로 나타나는지를 보여주기 위한 회귀분석 결과를 보여준다. 회귀분석은 어떠한 두 가지 변수 사이의 인과관계를 분석하는 데 사용되는 통계방법이다. <더플랜>이 보여준 단순회귀분석에서 종속변인은 K값의 분자인 미분류표에서의 득표율비, 독립변인은 K값의 분모인 분류표에서의 득표율비다.

[ 미분류표에서의 박근혜/문재인 득표비 ] = [ 분류표에서의 박근혜/문재인 득표비 ] X 1.5

이 회귀모형에 따르면 분류표에서의 득표비에 1.5를 곱하면 미분류표에서의 득표비를 예측할 수 있다. 분석 결과 회귀모형의 설명력을 의미하는 R제곱이 0.98로 매우 높게 나타났다. <더 플랜>은 이 수치가 사람이 개입한 확실한 증거라고 주장한다.

▲영화 <더플랜>중 회귀분석 설명 장면

▲영화 <더플랜>중 회귀분석 설명 장면

후보간 미분류율 차이, 지지성향과 투표자 연령대로 상당부분 설명돼

K값은 박근혜 후보의 미분류율을 문재인 후보의 미분류율로 나눈 값과 사실상 같은 값이다. 예를 들어, 두 후보의 미분류율이 같다면, 분류표에서의 두 후보 득표율비가 미분류표에서도 그대로 유지되어 K값은 1이 된다. 박 후보의 미분류율이 더 높으면 K값은 1보다 커지고, 문 후보의 미분류율이 더 높으면 반대로 K값이 1보다 작아진다. 18대 대선에서 박근혜 후보의 미분류율 3.67%를 문재인 후보의 미분류율 2.67%로 나누면 1.38이 나온다. 이 값은 전국 단위에서 K값을 계산한 결과인 1.39와 거의 같다.

고려대 통계학과 박유성 교수, 고려대 공공정책대학 최보승 교수, 경기대 경영학과 이동희 교수에게 분석을 의뢰했다.

그 결과 두 후보의 미분류율 차이(박 후보 미분류율 – 문 후보 미분류율)가 선거구의 지지성향(박근혜 득표율/문재인 득표율)과 투표자 연령대(투표자 중 특정 연령대의 점유율)로 상당 부분 설명된다는 것을 확인했다. 특정 연령대 투표자의 점유율 데이터는 선관위에서 전체 투표자 10%에 대해서 표본조사하는 18대 대선 투표율 분석 자료를 사용했다.

2017070702_03

미분류율이 높은 곳에서는 미분류율의 차이도 높게 나타났다. 따라서 선거구마다 서로 다른 미분류율 수준을 통제하기 위해 회귀분석에 미분류율을 포함했다. 독립변인인 지지성향과 60대 이상 투표자의 점유율은 미분류율을 통제한 상태에서도 (T검정의 유의확률이 0.05 이하로 나타나) 모두 유의미한 것으로 나타났다. 즉, 박근혜 후보를 더 지지하는 성향이 강할수록, 그리고 투표자 중 60대 이상 투표자의 점유율이 높을수록 두 후보 간 미분류율 차가 커지는 인과관계가 확인된 것이다. 20~30대 투표자 점유율이 높아지면 미분류율 차가 작아지는 관계도 확인됐다. 그러나 20~30대 비율은 60대 이상 비율과 -0.9 이상의 강한 상관관계를 보여 사실상 같은 변수(다중공선성 존재)로 보고 분석에서 제외했다. 이 밖에 40대 비율이나 50대 비율은 유의하지 않은 것으로 확인돼 마찬가지로 분석에서 제외했다.

2017070702_04

미분류율의 차이를 종속변인으로 제안한 고려대 통계학과 박유성 교수는 분석 결과 “보수가 미분류율을 높게 하는 경향이 있고, 이러한 가설이 꽤 설명력이 있다”고 말했다. 박 교수는 이러한 현상이 18대 대선뿐만 아니라 19대 대선에서도 반복됐다고 설명했다. 다른 통계학자도 비슷한 분석을 내놓았다. 고려대 공공정책대학 최보승 교수는 “한 지역에서 60대의 투표비율이 높아지면 높아질수록 박근혜의 미분류율이 문재인의 미분류율보다 더 많이 커진다”고 분석 결과를 설명했다.

한편, <더플랜> 측이 내놓은 R제곱 값 0.98에 대해 통계학자들은 그 수치를 있는 그대로 받아들이기 어렵다는 해석을 내놓았다. 회귀분석은 독립변인과 종속변인 사이의 인과관계를 분석하는 방법인데, <더플랜> 분석에서 사용한 독립변인(분류표에서의 박근혜/문재인 득표비)과 종속변인(미분류표에서의 박근혜/문재인 득표비) 사이의 인과관계를 확인할 수 없다는 것이다. 최보승 교수는 이 경우에는 R제곱이 높다고 해도 단순히 두 변인 사이에 강한 상관관계가 있을 뿐, 인과관계가 증명됐다고 보기 어렵다고 말했다.

박유성 교수도 <더플랜>이 회귀분석한 독립변인과 종속변인은 같은 추세로 움직이는 것이 당연한 데이터인데 인과관계를 분석한다는 것은 적절하지 않다고 말했다.

데이터 공개

뉴스타파는 분석한 내용을 투명하게 공개하려는 취지에서 이번 분석에 사용된 18대 대선 데이터와 19대 대선 데이터를 공개한다. 아래 링크에서 데이터를 다운받을 수 있다.

– 18대 대선 투표지 분류기 운영결과 – 회귀분석 데이터
– 19대 대선 투표지 분류기 운영결과 확인

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문

박근혜 대통령은 부당한 선거개입 중단하라!

‘진박’인사 위한 대구지역 방문은 국민 우롱하는 불법선거운동
정치중립 의무 위반은 헌법상 탄핵소추 대상

 

박근혜 대통령이 지난 3월 10일 “창조경제 성과 확산을 독려” 한다며 기획재정부 차관 등과 함께 대구·경북 지역을 방문했다. 그러나 총선을 앞둔 시점에서, 그것도 여당 내부의 공천갈등이 격화된 상황에서 대통령 지지층이 결집된 지역을 방문하는 것은 표심을 결집하기 위한 정치적 행보로밖에 해석되지 않는다. 대통령은 명백하게 정치적 중립의무를 어긴 것이다. 너무나 노골적인 선거 개입이 황당할 지경이다. 박근혜 대통령은 자신에게 충성을 바치는 인사들의 공천과 당선을 돕는 불법선거개입 행위를 당장 멈춰야 한다. 

 

박근혜 대통령이 방문한 지역은 대구광역시 동구, 북구, 수성구 등으로, 이른바 ‘진박’으로 분류되는 새누리당 인사들이 예비후보로 등록한 지역이다. 청와대는 대통령의 방문이 후보들에 대한 신뢰도와 지지도에 영향을 줄 것을 예상할 수 있었음에도 불구하고, 일정을 조정하거나 방문 지역을 변경하지 않았다. 선거개입 논란이 불거진 뒤에도, 순수한 “민생 행보”일 뿐이라며 모르쇠로 일관했다. 국민을 우롱하는 후안무치하고, 오만한 태도가 아닐 수 없다. 

 

청와대가 아무리 부인해도, 박근혜 대통령의 대구 방문은 지역 유권자들에겐 특정 후보들에 대한 지지의 메시지로 읽혔을 것이 분명하다. 실제로 지역주민들은 이 날 언론 인터뷰를 통해 “대통령이 대구를 챙겨주려는 시도 자체는 좋은 것”이라며, “대통령과 가까운 후보에게 호감이 간다”고 말했다고 한다. 대통령의 방문이 지역민심에 영향을 주고 있다는 것이 분명함에도 청와대는 선거개입이 아니라고 발뺌할 것인가? 

 

공직선거법 9조는 “공무원 기타 정치적 중립을 지켜야 하는 자(기관 단체를 포함한다)는 선거에 대한 부당한 영향력의 행사 기타 선거결과에 영향을 미치는 행위를 하여서는 아니된다”고 규정하고 있다. 공무원이 정치적 중립 의무를 어기는 것은 명백한 위헌·위법행위이다. 행정부 수장인 대통령 역시 정치적 중립을 지켜야 하는 공무원의 범위에 당연히 포함된다. 또한 대한민국 헌법은 “공무원이 그 직무집행에 있어서 헌법이나 법률을 위배한 때”에 탄핵소추의 대상이 될 수 있다고 명시하고 있다. 2004년 당시 노무현 대통령은 “대통령이 뭘 잘 해서 열린우리당이 표를 얻을 수만 있다면 합법적인 모든 것을 다하고 싶다”는 몇 마디 말 때문에 탄핵소추를 당했다. 선례에 비춰본다면, 박근혜 대통령의 이번 행보는 정치적 중립의무를 저버린 불법적인 선거개입행위에 해당한다. 이러한 불법적인 선거개입은 헌법 상 탄핵사유에 해당한다는 것을 박근혜 대통령은 명심해야 할 것이다.

 

현장 행보를 빙자한 청와대발 선거운동이 계속되는 것을 국민들은 두고 보지 않을 것이다. 이러한 무책임하고 노골적인 선거개입과 중립 의무 위반은 국민의 심판 받을 것이다. 박근혜 대통령은 ‘대통령의 사람’이 아니라 ‘국민의 대표’가 자유롭게 선출될 수 있도록 더 이상 국회의원 선거에 개입하지 말아야 한다. 

화, 2016/03/15- 16:24
335
0
국회의원 명부를 보면 늘 서울 종로구가 1번으로 나오게 되어 있습니다. 그런 상징적인 곳입니다. 오세훈 시장은... 또 현재 여론조사에서 대개 선두를 달리고 있을 정도로 지지율이 높고 지금 박근혜 대통령 빼놓고 후보군이었던...
월, 2016/03/28- 13:00
335
0
[여론조사결과] KBS·연합뉴스 20대총선 2차 판세분석 조사_1(통계표) ☞ 서울 종로구 [PDF] ☞ 서울 도봉구을 [PDF] ☞ 서울 노원구병 [PDF] ☞ 서울 마포구갑 [PDF] ☞ 서울 영등포갑 [PDF] ☞ 서울 영등포을 [PDF] ☞ 서울 서대문갑...
목, 2016/03/24- 08:06
335
0
정무수석 출신의 이정현 의원(전남 순천)과 곽상도 전 민정수석(대구 중구남구), 민경욱 전 청와대 대변인... 정무수석 출신의 김효재 전 의원(서울 성북을)과 이상휘 전 춘추관장(동작갑)은 결선 여론조사 결과를 초조하게...
토, 2016/03/19- 20:15
335
0
박근혜 정부의 테러방지법을 둘러싼 여야간 대치전이 극에 치달은 가운데 정의화 국회의장이 테러방지법 직권 상정에 따른 19대 국회 막판 47년만에 필리버스터(무제한 토론)가 국민들의 폭발적인 반응을 이끌어 내면서 박근혜 정부의 대테러방지법이 난관에 봉착했다. 그리고 김광진 은수미 박원석 의원의 놀라운 토론에 응원과 정치 후원금이 쇄도하고 있다. 47년만의 필리버스터에 폭발하는 SNS 반응을 스토리파이로 정리합니다.
수, 2016/02/24- 23:12
335
0