주요 콘텐츠로 건너뛰기

18대, 19대 대선 데이터 & 분석 자료 공개

지역

18대, 19대 대선 데이터 & 분석 자료 공개

익명 (미확인) | 금, 2017/07/07- 18:33

K값 1.5 만든 후보 간 미분류율 차이… 지지성향과 투표자 연령대가 만들었다

영화 <더 플랜>, K값 1.5와 R제곱 0.98을 근거로 개표 조작 의혹 제기해

<더 플랜>은 18대 대선 개표에 사용된 투표지 분류기가 누군가에 의해 조작됐다는 의혹을 제기했다. 당시 투표지 분류기가 성공적으로 분류한 ‘분류표’에서의 각 후보 득표율이 분류를 보류한 ‘미분류표’에서의 득표율과 다르게 나타난 것이 부정 개표의 핵심적인 정황증거로 제시됐다. 이른바 전국 251개 선거구에서 구한 ‘K값’의 평균이 1.5라는 것이다.

2017070702_01

K값의 분자는 미분류표에서의 박근혜, 문재인 후보 득표 비율이고, 분모는 분류표에서의 두 후보 득표 비율이다. 즉, K값이 1보다 크다는 것은 미분류표에서는 박근혜 후보의 득표율이 높아졌고, 문재인 후보의 득표율은 낮아졌다는 것을 의미한다. 이 현상은 18대 대선 당시 전국 251개 개표구 대부분에서 일관되게 나타났다. <더플랜>은 이러한 규칙성을 사람이 개입한 인위적인 흔적이라고 설명한다.

<더플랜>은 분류표와 미분류표에서의 득표율 차가 얼마나 규칙적으로 나타나는지를 보여주기 위한 회귀분석 결과를 보여준다. 회귀분석은 어떠한 두 가지 변수 사이의 인과관계를 분석하는 데 사용되는 통계방법이다. <더플랜>이 보여준 단순회귀분석에서 종속변인은 K값의 분자인 미분류표에서의 득표율비, 독립변인은 K값의 분모인 분류표에서의 득표율비다.

[ 미분류표에서의 박근혜/문재인 득표비 ] = [ 분류표에서의 박근혜/문재인 득표비 ] X 1.5

이 회귀모형에 따르면 분류표에서의 득표비에 1.5를 곱하면 미분류표에서의 득표비를 예측할 수 있다. 분석 결과 회귀모형의 설명력을 의미하는 R제곱이 0.98로 매우 높게 나타났다. <더 플랜>은 이 수치가 사람이 개입한 확실한 증거라고 주장한다.

▲영화 <더플랜>중 회귀분석 설명 장면

▲영화 <더플랜>중 회귀분석 설명 장면

후보간 미분류율 차이, 지지성향과 투표자 연령대로 상당부분 설명돼

K값은 박근혜 후보의 미분류율을 문재인 후보의 미분류율로 나눈 값과 사실상 같은 값이다. 예를 들어, 두 후보의 미분류율이 같다면, 분류표에서의 두 후보 득표율비가 미분류표에서도 그대로 유지되어 K값은 1이 된다. 박 후보의 미분류율이 더 높으면 K값은 1보다 커지고, 문 후보의 미분류율이 더 높으면 반대로 K값이 1보다 작아진다. 18대 대선에서 박근혜 후보의 미분류율 3.67%를 문재인 후보의 미분류율 2.67%로 나누면 1.38이 나온다. 이 값은 전국 단위에서 K값을 계산한 결과인 1.39와 거의 같다.

고려대 통계학과 박유성 교수, 고려대 공공정책대학 최보승 교수, 경기대 경영학과 이동희 교수에게 분석을 의뢰했다.

그 결과 두 후보의 미분류율 차이(박 후보 미분류율 – 문 후보 미분류율)가 선거구의 지지성향(박근혜 득표율/문재인 득표율)과 투표자 연령대(투표자 중 특정 연령대의 점유율)로 상당 부분 설명된다는 것을 확인했다. 특정 연령대 투표자의 점유율 데이터는 선관위에서 전체 투표자 10%에 대해서 표본조사하는 18대 대선 투표율 분석 자료를 사용했다.

2017070702_03

미분류율이 높은 곳에서는 미분류율의 차이도 높게 나타났다. 따라서 선거구마다 서로 다른 미분류율 수준을 통제하기 위해 회귀분석에 미분류율을 포함했다. 독립변인인 지지성향과 60대 이상 투표자의 점유율은 미분류율을 통제한 상태에서도 (T검정의 유의확률이 0.05 이하로 나타나) 모두 유의미한 것으로 나타났다. 즉, 박근혜 후보를 더 지지하는 성향이 강할수록, 그리고 투표자 중 60대 이상 투표자의 점유율이 높을수록 두 후보 간 미분류율 차가 커지는 인과관계가 확인된 것이다. 20~30대 투표자 점유율이 높아지면 미분류율 차가 작아지는 관계도 확인됐다. 그러나 20~30대 비율은 60대 이상 비율과 -0.9 이상의 강한 상관관계를 보여 사실상 같은 변수(다중공선성 존재)로 보고 분석에서 제외했다. 이 밖에 40대 비율이나 50대 비율은 유의하지 않은 것으로 확인돼 마찬가지로 분석에서 제외했다.

2017070702_04

미분류율의 차이를 종속변인으로 제안한 고려대 통계학과 박유성 교수는 분석 결과 “보수가 미분류율을 높게 하는 경향이 있고, 이러한 가설이 꽤 설명력이 있다”고 말했다. 박 교수는 이러한 현상이 18대 대선뿐만 아니라 19대 대선에서도 반복됐다고 설명했다. 다른 통계학자도 비슷한 분석을 내놓았다. 고려대 공공정책대학 최보승 교수는 “한 지역에서 60대의 투표비율이 높아지면 높아질수록 박근혜의 미분류율이 문재인의 미분류율보다 더 많이 커진다”고 분석 결과를 설명했다.

한편, <더플랜> 측이 내놓은 R제곱 값 0.98에 대해 통계학자들은 그 수치를 있는 그대로 받아들이기 어렵다는 해석을 내놓았다. 회귀분석은 독립변인과 종속변인 사이의 인과관계를 분석하는 방법인데, <더플랜> 분석에서 사용한 독립변인(분류표에서의 박근혜/문재인 득표비)과 종속변인(미분류표에서의 박근혜/문재인 득표비) 사이의 인과관계를 확인할 수 없다는 것이다. 최보승 교수는 이 경우에는 R제곱이 높다고 해도 단순히 두 변인 사이에 강한 상관관계가 있을 뿐, 인과관계가 증명됐다고 보기 어렵다고 말했다.

박유성 교수도 <더플랜>이 회귀분석한 독립변인과 종속변인은 같은 추세로 움직이는 것이 당연한 데이터인데 인과관계를 분석한다는 것은 적절하지 않다고 말했다.

데이터 공개

뉴스타파는 분석한 내용을 투명하게 공개하려는 취지에서 이번 분석에 사용된 18대 대선 데이터와 19대 대선 데이터를 공개한다. 아래 링크에서 데이터를 다운받을 수 있다.

– 18대 대선 투표지 분류기 운영결과 – 회귀분석 데이터
– 19대 대선 투표지 분류기 운영결과 확인

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문
역사교과서 국정화 추진 중단하라- 박근혜정부, 역사와 교육도 농단할 셈인가? -교육부는 오늘(...
화, 2016/11/29- 09:47
351
0


참여연대, 청와대 앞 100미터까지 행진 보장 법원 결정 이끌어내 

 집회금지장소 정한 집시법 제11조는 계속 다투고 개정 촉구할 것


   대통령 퇴진을 외치는 행렬이 드디어 청와대 담장 100미터 앞까지 전진할 수 있게 되었다. 오늘(12/2) 서울행정법원 제6부(재판장 김정숙 부장판사)는 박근혜정권퇴진 비상국민행동(퇴진국민행동)이 신고한 12월 3일 집회 및 행진에 대해 경찰이 내린 금지통고와 조건통보를 대부분 집행정지시키며 헌정사상 청와대에서 가장 가까운 거리에서 집회와 행진이 보장될 수 있게 하는 역사적 결정을 내렸다. 그 동안 다섯 차례에 걸쳐 주말 집회 때마다 집행정지 가처분을 맡아온 참여연대 공익법센터(양홍석, 김선휴 변호사)가 이번 집행정지 사건도 맡아서 진행하였다.  
 

  이번에 최초로 열린 행진 구간은 청운효자동주민센터에서 청와대 경계 100m지점(효자치안센터)까지, 정부서울청사 창성동별관에서 청와대 경계 100m지점(자하문로16길 21앞)까지, 세움아트스페이스에서 청와대 경계 100m지점(126맨션)까지이고, 각 최북단 지점인 효자치안센터, 자하문로 16길 21 앞, 126맨션 앞에서의 집회도 가능하게 되었다. 다만 이 지점에서의 집회 및 행진은 일몰시간을 고려한 17:30까지로 제한되었다. 

 

  또한 청운효자동 주민센터, 창성동별관, 세움아트스페이스까지의 행진 및 집회는 지난 주(11/26)에는 17:30까지 시간제한이 있었으나, 청운효자동 주민센터 맞은편 푸르메재활센터 앞 집회도 22:30까지 허용되는 등 주간 뿐 아니라 야간에도 촛불을 든 시민들이 청와대에 보다 가까이 갈 수 있게 되었다. 그 동안 행정법원은 촛불집회의 행진코스가 청와대쪽으로 계속 근접하는 것에 대해서 주간행진을 우선 허용한 다음 야간행진까지 점진적으로 허용하는 방향으로 집회, 행진가능범위를 넓혀왔는데, 이번에 청와대 경계 100미터 지점까지 주간의 행진을 허용한 만큼, 앞으로도 집회 및 행진 경험의 축적에 따라 더 진전될 가능성이 있다.  

 

  다만 신고한 행진 경로 중 청와대 분수대 앞인 효자삼거리를 지나는 부분은 시간대를 불문하고 제한하였는데, 집시법 제11조 제2호 소정의 ‘대통령 관저의 경계지점으로부터 100미터 이내의 장소’에 해당한다고 해석할 여지가 있다고 보았기 때문이다. 재판부도 ‘해석할 여지’가 있다고 판시하였을 뿐 집시법 제11조의 집회금지장소에 포함된다고 단정하지 않은 만큼, 이 부분에 대한 해석과 절대적 집회금지구역을 규정한 집시법 제11조의 위헌성을 계속 다퉈나갈 것이고, 국회에서 집시법 제11조의 전면적 개정이 이루어질 수 있도록 촉구해나갈 것이다. 참여연대는 이미 지난 11월 3일에도 청와대 정문 앞 백일장대회 금지통고에 대해 취소소송을 제기하며 집시법 제11조의 위헌성을 주장해온 바 있다(https://goo.gl/CEGB16). 

 

  이번 법원 결정은 지난 한 달이 넘는 기간 동안 매 주말마다 촛불을 들며 집회시위의 새로운 장을 열어간 수십 수백만 시민들의 열망의 반영이다. 여전히 청와대 담장 안에서 주권자의 목소리를 듣지 않는 박근혜 대통령을 향해 내일 더욱 큰 분노와 항의가 생생히 전달되기를 기대한다. 끝.


▣ 별첨자료
집행정지 결정문(서울행정법원 2016아12523)

 

 

 

토, 2016/12/03- 00:26
351
0
CNN, 국정원 직원, 유서 남기고 자살– 내국인 사찰과 선거 개입은 없었으며 대북 사찰과 관련한 자료 삭제했다고 유서에 남겨– 국정원, 해킹 프로그램 구매는 “연구의 목적”이었다고 해명…야당, 사실 조사할 것CNN은 20일 자살한 국정원 직원이 남긴 유서의 내용과 국정원의 해킹 프로그램 구매를 둘러싼 논란을 보도했다. 기사는 자살한 것으로 추정되는 40대의 남성이 자신을 국정원 직원이라고 밝히고 “분란을 일으켜 죄송하다”고 ...
화, 2015/07/21- 12:42
351
0
이란 프레스 TV, 국정원 해킹…한국인들 스마트 폰 습관 바꿔– 한국 정부의 사찰은 단순 도청 수준 넘어– 이용자들, 국외 서비스망 사용하고 직접 만나는 방법 취해– 해킹 추문으로 나라 꼴 엉망진창 – 국정원, 2012년 야당 대선 후보 비방글 유포 혐의로 기소돼이란의 프레스 TV는 25일 ‘한국 해킹 스캔들 드러나다’라는 영상 보도에서 정부의 감시를 피하려는 한국인들이 스마트 폰 사용 ...
월, 2015/07/27- 11:26
350
0

더불어민주당 비례대표 후보인 최운열 서강대 명예교수가 논문 ‘중복 게재’ 행위로 연구윤리규정을 위반한 사실이 드러났다.

뉴스타파 취재 결과, 최운열 교수는 2004년 전문학술지에 논문을 투고하면서 핵심 내용을 1년 전 자신이 발표한 논문에서 그대로 옮겨왔으나 인용이나 출처 표기를 하지 않은 것으로 나타났다. 최 교수는 논문 중복 게재를 인정했다.

▲ 왼쪽이 2003년 <서강경영논총>에 게재한 논문, 오른쪽이 2004년 <증권학회지>에 게재한 논문이다.

▲ 왼쪽이 2003년 <서강경영논총>에 게재한 논문, 오른쪽이 2004년 <증권학회지>에 게재한 논문이다.

최운열 교수는 지난 2004년 6월, 한국증권학회에서 발행하는 전문학술지인 <증권학회지>에 제자 정 모 씨 등 2명과 함께 공동저자 형태로 학술논문을 게재했다. 제목은 ‘인지행위적 재무론에서 개인투자자들의 처분효과에 관한 연구’이다. 논문 분량은 참고 문헌과 요약을 빼고 17쪽이다. <증권학회지>는 한국연구재단에 등재학술지로 지정돼 있다.

최 교수가 발표한 이 논문은 자신이 1년 전 서강대 교내 학술지인 <서강경영논총>에 실은 ‘한국주식시장에서의 처분효과에 관한 실증연구’라는 제목의 논문 내용을 상당 부분 그대로 옮겨온 것으로 확인됐다. 두 논문을 대조한 결과, 2004년 논문의 3장 ‘분석자료 및 연구방법’ 5쪽 가운데 80% 정도가 2003년 논문과 일치했다. 표본 조사 집단의 내용과 도표가 같았다. 또 4장 ‘연구결과’ 역시 도표를 포함해 절반 가까이 이전 논문과 동일했고, 5장 ‘결론’에서 후속 연구를 제안하는 내용도 이전 논문에서 거의 그대로 옮겨왔다.

▲ 최운열 교수는 2004년 논문(오른쪽)의 3장 <분석자료 및 연구방법>과 4장 <연구결과>, 5장 <결론>의 상당 부분을 2003년 논문에서 그대로 옮겨왔다.

▲ 최운열 교수는 2004년 논문(오른쪽)의 3장 <분석자료 및 연구방법>과 4장 <연구결과>, 5장 <결론>의 상당 부분을 2003년 논문에서 그대로 옮겨왔다.

다만 이전 논문에서는 가설에서 “실현이익비율은 실현손실비율보다 클 것이다”를 2004년 논문에서는 “전체기간동안 PGR은 PLR보다 클 것이다.”로 하는 등 실현이익비율(PGR)과 실현손실비율(PLR)의 표기 방식을 달리했다. 또 주식시장의 ‘상승장’을 ‘상승추세’로, ‘하락장’을 ‘하락추세’로 바꿨다. “자주 매도한다는 것을 알 수 있었다”를 “자주 매도된다는 것을 알 수 있었다”로 바꾼 문장도 있었다.

최 교수는 이처럼 자신이 이전에 쓴 논문의 상당 부분을 그대로 베꼈지만 2004년 논문 어디에도 이전 논문을 인용했다는 출처 표기를 하지 않았다. 참고 문헌에도 적지 않았다. 이는 학계에서 인정하고 있는 ‘인용 없는 논문 대 논문 간 중복게재’에 해당되는 것이다.

한국금융학회가 2007년 제정한 연구윤리규정은 “학회에 투고하는 연구논문은 국내외를 막론하고 다른 간행물에 이미 게재되었거나 새로운 연구물인 것처럼 중복해서 투고하는 것이 아니어야 한다”고 규정하고 이를 위반할 경우 “연구 부정행위로 판정하여 처리한다”고 명시하고 있다.

제5조 (중복게재의 금지)한국증권학회 연구윤리규정

① 학회에 투고하는 연구논문은 국내외를 막론하고 다른 간행물에 이미 게재되었거나 새로운 연구물인 것처럼 중복해서 투고하는 것이 아니어야 한다.
② 학회에 접수된 투고논문이 제1항을 위반하였음이 확인되면 연구부정행위로 판정하여 처리한다.

최 교수는 이메일 답변을 통해 “인용이나 출처 표시 과정에서 미처 신경 쓰지 못했던 부분이 있었던 것 같다. 그 당시에 좀 더 주의를 기울여야 했는데 그러지 못했던 점이 아쉽다.’며 사실상 논문 중복 게재 사실을 인정했다.

최 교수는 지난해 서강대 경영학부 교수에서 정년 퇴임했으며, 한국증권연구원 원장, 코스닥위원회 위원장, 한국은행 금융통화위원회 위원, 한국증권학회 회장 등을 역임했다.

뉴스타파는 어제(3월 21일) 더불어민주당 비례대표 1번으로 발표된 박경미 교수가 제자의 석사논문을 인용없이 상당 부분 그대로 베낀 논문을 학술지에 투고한 사실을 추가로 확인해 보도한 바 있다.(링크)

화, 2016/03/22- 14:52
350
0