주요 콘텐츠로 건너뛰기

18대, 19대 대선 데이터 & 분석 자료 공개

지역

18대, 19대 대선 데이터 & 분석 자료 공개

익명 (미확인) | 금, 2017/07/07- 18:33

K값 1.5 만든 후보 간 미분류율 차이… 지지성향과 투표자 연령대가 만들었다

영화 <더 플랜>, K값 1.5와 R제곱 0.98을 근거로 개표 조작 의혹 제기해

<더 플랜>은 18대 대선 개표에 사용된 투표지 분류기가 누군가에 의해 조작됐다는 의혹을 제기했다. 당시 투표지 분류기가 성공적으로 분류한 ‘분류표’에서의 각 후보 득표율이 분류를 보류한 ‘미분류표’에서의 득표율과 다르게 나타난 것이 부정 개표의 핵심적인 정황증거로 제시됐다. 이른바 전국 251개 선거구에서 구한 ‘K값’의 평균이 1.5라는 것이다.

2017070702_01

K값의 분자는 미분류표에서의 박근혜, 문재인 후보 득표 비율이고, 분모는 분류표에서의 두 후보 득표 비율이다. 즉, K값이 1보다 크다는 것은 미분류표에서는 박근혜 후보의 득표율이 높아졌고, 문재인 후보의 득표율은 낮아졌다는 것을 의미한다. 이 현상은 18대 대선 당시 전국 251개 개표구 대부분에서 일관되게 나타났다. <더플랜>은 이러한 규칙성을 사람이 개입한 인위적인 흔적이라고 설명한다.

<더플랜>은 분류표와 미분류표에서의 득표율 차가 얼마나 규칙적으로 나타나는지를 보여주기 위한 회귀분석 결과를 보여준다. 회귀분석은 어떠한 두 가지 변수 사이의 인과관계를 분석하는 데 사용되는 통계방법이다. <더플랜>이 보여준 단순회귀분석에서 종속변인은 K값의 분자인 미분류표에서의 득표율비, 독립변인은 K값의 분모인 분류표에서의 득표율비다.

[ 미분류표에서의 박근혜/문재인 득표비 ] = [ 분류표에서의 박근혜/문재인 득표비 ] X 1.5

이 회귀모형에 따르면 분류표에서의 득표비에 1.5를 곱하면 미분류표에서의 득표비를 예측할 수 있다. 분석 결과 회귀모형의 설명력을 의미하는 R제곱이 0.98로 매우 높게 나타났다. <더 플랜>은 이 수치가 사람이 개입한 확실한 증거라고 주장한다.

▲영화 <더플랜>중 회귀분석 설명 장면

▲영화 <더플랜>중 회귀분석 설명 장면

후보간 미분류율 차이, 지지성향과 투표자 연령대로 상당부분 설명돼

K값은 박근혜 후보의 미분류율을 문재인 후보의 미분류율로 나눈 값과 사실상 같은 값이다. 예를 들어, 두 후보의 미분류율이 같다면, 분류표에서의 두 후보 득표율비가 미분류표에서도 그대로 유지되어 K값은 1이 된다. 박 후보의 미분류율이 더 높으면 K값은 1보다 커지고, 문 후보의 미분류율이 더 높으면 반대로 K값이 1보다 작아진다. 18대 대선에서 박근혜 후보의 미분류율 3.67%를 문재인 후보의 미분류율 2.67%로 나누면 1.38이 나온다. 이 값은 전국 단위에서 K값을 계산한 결과인 1.39와 거의 같다.

고려대 통계학과 박유성 교수, 고려대 공공정책대학 최보승 교수, 경기대 경영학과 이동희 교수에게 분석을 의뢰했다.

그 결과 두 후보의 미분류율 차이(박 후보 미분류율 – 문 후보 미분류율)가 선거구의 지지성향(박근혜 득표율/문재인 득표율)과 투표자 연령대(투표자 중 특정 연령대의 점유율)로 상당 부분 설명된다는 것을 확인했다. 특정 연령대 투표자의 점유율 데이터는 선관위에서 전체 투표자 10%에 대해서 표본조사하는 18대 대선 투표율 분석 자료를 사용했다.

2017070702_03

미분류율이 높은 곳에서는 미분류율의 차이도 높게 나타났다. 따라서 선거구마다 서로 다른 미분류율 수준을 통제하기 위해 회귀분석에 미분류율을 포함했다. 독립변인인 지지성향과 60대 이상 투표자의 점유율은 미분류율을 통제한 상태에서도 (T검정의 유의확률이 0.05 이하로 나타나) 모두 유의미한 것으로 나타났다. 즉, 박근혜 후보를 더 지지하는 성향이 강할수록, 그리고 투표자 중 60대 이상 투표자의 점유율이 높을수록 두 후보 간 미분류율 차가 커지는 인과관계가 확인된 것이다. 20~30대 투표자 점유율이 높아지면 미분류율 차가 작아지는 관계도 확인됐다. 그러나 20~30대 비율은 60대 이상 비율과 -0.9 이상의 강한 상관관계를 보여 사실상 같은 변수(다중공선성 존재)로 보고 분석에서 제외했다. 이 밖에 40대 비율이나 50대 비율은 유의하지 않은 것으로 확인돼 마찬가지로 분석에서 제외했다.

2017070702_04

미분류율의 차이를 종속변인으로 제안한 고려대 통계학과 박유성 교수는 분석 결과 “보수가 미분류율을 높게 하는 경향이 있고, 이러한 가설이 꽤 설명력이 있다”고 말했다. 박 교수는 이러한 현상이 18대 대선뿐만 아니라 19대 대선에서도 반복됐다고 설명했다. 다른 통계학자도 비슷한 분석을 내놓았다. 고려대 공공정책대학 최보승 교수는 “한 지역에서 60대의 투표비율이 높아지면 높아질수록 박근혜의 미분류율이 문재인의 미분류율보다 더 많이 커진다”고 분석 결과를 설명했다.

한편, <더플랜> 측이 내놓은 R제곱 값 0.98에 대해 통계학자들은 그 수치를 있는 그대로 받아들이기 어렵다는 해석을 내놓았다. 회귀분석은 독립변인과 종속변인 사이의 인과관계를 분석하는 방법인데, <더플랜> 분석에서 사용한 독립변인(분류표에서의 박근혜/문재인 득표비)과 종속변인(미분류표에서의 박근혜/문재인 득표비) 사이의 인과관계를 확인할 수 없다는 것이다. 최보승 교수는 이 경우에는 R제곱이 높다고 해도 단순히 두 변인 사이에 강한 상관관계가 있을 뿐, 인과관계가 증명됐다고 보기 어렵다고 말했다.

박유성 교수도 <더플랜>이 회귀분석한 독립변인과 종속변인은 같은 추세로 움직이는 것이 당연한 데이터인데 인과관계를 분석한다는 것은 적절하지 않다고 말했다.

데이터 공개

뉴스타파는 분석한 내용을 투명하게 공개하려는 취지에서 이번 분석에 사용된 18대 대선 데이터와 19대 대선 데이터를 공개한다. 아래 링크에서 데이터를 다운받을 수 있다.

– 18대 대선 투표지 분류기 운영결과 – 회귀분석 데이터
– 19대 대선 투표지 분류기 운영결과 확인

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문
온라인 커뮤니티 갈무리 4·13 총선을 앞두고 서울 송파구(병) 선거구에서 3선에 도전하는 김을동(70) 새누리당 의원(최고위원)이 선거 홍보물에 가족의 사진을 실었다. 현수막에 후보자의 정책이나 비전을 소개하기보다 가족의...
목, 2016/02/18- 17:56
330
0
경주) 예비후보가 14일 경주시청 브리핑실에서 기자회견을 갖고 무소속 출마를 선언했다. 정 예비후보는 이 자리에서 "자신은 당에서 정해 둔 공천부적격자 기준에 전혀 해당되지 않는다"며 "각종 여론조사에서 3강으로 분류되던...
월, 2016/03/14- 15:16
330
0
NYT, 한국법원 이완구 전 총리 ‘불법정치자금 수수 혐의’ 유죄 선고 – 징역 8개월 집행유예 2년 63일만에 불명예 사퇴한 대한민국 헌정상 초단명 국무총리인 이완구(65) 전 총리가 2013년 이미 고인이 된 성완종 전 회장으로부터 한화 3천만원(약 24,900달러)를 불법정치자금으로 수수한 혐의로 징역 8개월에 집행유예 2년을 선고받았다고 뉴욕타임즈가 29일 보도했다. 기사는 성 전 회장이 남긴 쪽지와 그가 사망한 후 ...
토, 2016/01/30- 09:27
330
0

“선거구획정위 회의록 공개하라” 1심 판결 환영

획정 과정 투명하게 공개하여 국민의 알권리 실질적으로 보장해야
중앙선관위, 법원 판결 수용하여 즉각 공개해야

 

 

서울행정법원 제11부(재판장 하태흥) 은 참여연대가 지난 해 6월, 중앙선관위를 상대로 낸 20대 총선 선거구획정위원회 회의록 비공개 취소소송에서 발언자의 인적사항을 제외한 회의록 일체를 공개하라고 판결하였다. 참여연대 의정감시센터는 선거구 획정 과정을 투명하게 공개해 유권자 알 권리를 보장해야 한다고 판단한 이번 결정을 환영한다. 중앙선관위는 법원 판결을 수용하여 회의록을 즉각 공개해야 한다.  

 

재판부는 ‘선거구획정의 결과 뿐만 아니라 획정을 위한 회의가 자유롭고 공정하게 진행되었는지 등 결과를 도출하는 과정 자체도 유권자의 공적 관심사’라고 판시하며, 국민의 알권리를 실질적으로 보장해야 할 필요성이 매우 크다고 하였다. 또한, 재판부는 ‘회의록이 공개될 경우 획정위원회 업무의 공정한 수행에 지장을 받을 수 있다’는 중앙선관위의 비공개 사유와 달리, 오히려 회의록을 투명하게 공개하는 것이 향후 구성될 선거구획정위 위원들의 공정한 업무 수행에 도움을 줄 수 있다고 하였다. 선거구획정위 의사결정 과정에 직, 간접적으로 개입하려는 시도를 차단할 수 있고, 위원들이 특정 이익집단의 이익을 위해 업무수행을 하는 것도 예방할 수 있기 때문이다. 다만, 재판부는 발언내용 공개에 대한 심리적 부담으로 자유로운 의사교환이 어려울 수 있다는 점 때문에 발언자의 인적사항은 비공개가 타당하다고 판단했다. 

 

지난 20대 총선은 선거일 40여일을 앞둔 시점까지 선거구가 확정되지 않아, 정당과 후보자에 대한 충분한 정보를 얻고 평가하며 주권을 행사하여야 하는 유권자의 권리가 크게 훼손되었다. 이러한 사회적 혼란을 반복하지 않도록, 회의록 뿐 아니라 회의자료 일체도 공개하여 향후 선거구획정위원회 개혁 논의를 시작해야 한다. 참여연대는 공개되는 회의록을 바탕으로 선거구획정위원회 운영 개선 방향, 독립성 강화 방안 등을 제시할 것이다.  

 

[원문보기/다운로드]

 

 

월, 2017/09/04- 13:34
330
0

photo_2017-05-26_16-24-14

신곡보 철거요구 1인시위 4일차, 김경훈 서울복지시민연대 간사

photo_2017-05-26_16-24-14

○ 25일, 환경운동연합 등 시민사회단체와 진보정당은 경인운하 연장반대 및 신곡보철거를 요구하는 릴레이 1인시위를 이어갔다. 4일차 주자는 서울복지시민연대 김경훈 간사가 맡았다. 김경훈 간사는 "여의문화나루 조성사업의 면면을 들여다보면 이미 실패한 경인운하사업을 한강협력사업이라는 명목으로 한강을 개발하려는 의도로밖에 해석할 수 없다.“며, ”이는 한강의 자연성을 회복하겠다고 선언한 박원순 시장 본인의 약속과도 모순된다. 왜냐하면 이러한 사업은 신곡수중보를 유지하지 않고서는 진행이 불가능한 사업이기 때문“이라고 밝혔다. 더불어 ” 서울시민의 보다 나은 복지를 조성을 위해 토목이 아닌 환경과 사람에 재원을 사용해 주기를“ 당부했다.   ○ 1인 시위는 매일 점심시간마다 릴레이로 진행될 예정이다. 29일(월)은 생태보전시민모임 민성환 대표, 30일(화)은 정의당 서울시당 최용 정책위원장, 31일(수)은 하윤정 노동당 서울시당 부위원장이 릴레이를 이어간다. 환경운동연합 등은 이후에도 토론회, 감사청구 등의 활동을 이어나갈 예정이며, 30일에는 경인운하 연장하는 여의나루 토목사업 중단 및 박원순 시장 면담을 요청하는 기자회견을 개최할 계획이라고 밝혔다.  

2017년 5월 26일

환경운동연합

공동대표 권태선 박재묵 장재연 사무총장 염형철

[보도자료]신곡보 철거요구 1인시위 4일차, 김경훈 서울복지시민연대 간사

4대강후원배너

금, 2017/05/26- 16:53
330
0