주요 콘텐츠로 건너뛰기

여야, 총선 전략 요충지 7곳에서 총력전

지역

여야, 총선 전략 요충지 7곳에서 총력전

익명 (미확인) | 월, 2016/04/11- 17:03
매일경제신문이 지난 6일 이전에 실시된 여론조사 결과를 분석한 결과 3%포인트 이내의 박빙 승부를 예고한... 서울에서 가장 관심이 집중되는 지역구는 ‘정치 1번지’로 불리는 종로구다. 새누리당의 새로운 대권주자로 꼽히는...

시민들의 의견

댓글 달기

Plain text

  • 웹 페이지 주소 및 이메일 주소는 자동으로 링크로 전환됩니다.
  • 줄과 단락은 자동으로 분리됩니다.
  • 사용할 수 있는 HTML 태그: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd>
이미지
무제한 수의 파일을 이 필드에 업로드할 수 있습니다.
50 MB 한계입니다.
허용된 유형: png gif jpg jpeg.
Enter the YouTube URL. Valid URL formats include: http://www.youtube.com/watch?v=1SqBdS0XkV4 and http://youtu.be/1SqBdS0XkV4.
CAPTCHA
스펨 사용자 차단 질문

뉴스타파는 지난 두 달 동안 19대와 20대 국회의원의 정책 자료집 2천 6백여 건을 분석했다. 조사는 우선 20대 현직 의원을 중심으로 진행했다. 그 결과 정부 보도자료나 다른기관의 보고서 등을 베껴 정책자료집을 만든 현직 국회의원은 25명으로 확인됐다. 이들이 발간한 표절 정책자료집은 모두 35건이었다.

※ 현역의원 25명 전체 명단과 내역 보기

이번 조사와 분석은 국회도서관에서 확인 가능한 정책자료집을 대상으로 했다. 그러나 20대 국회의원의 경우 국회 도서관에 정책자료집이 등재돼 내용 확인을 할 수 있었던 의원은 191명에 그쳤다. 나머지 의원은 국회도서관에서 정책자료집을 찾을 수 없었다. 이는 의원들이 자신들의 정책자료집을 국회도서관에 제대로 등록해놓지 않았기 때문으로 추정된다. 결국 20대 의원 191명이 낸 1,254건의 정책자료집만을 조사할 수밖에 없었다.

뉴스타파는 이와 함께 표절 정책자료집 발간에 사용한 국회 예산 내역도 일부 확인했다. 자유한국당 안상수, 경대수, 이현재, 윤영석, 함진규 의원 등은 표절 정채자료집의 발간 비용으로 국회 예산을 자료집 1건 당 380만 원에서 890만 원까지 청구해 사용한 것으로 드러났다. 베낀 정책자료집 발간에 국민의 세금이 쓰여진 것이다.

나머지 의원 20여 명도 정책자료집 발간 비용으로 국회 예산을 타 낸 것이 확인됐지만 해당 의원이나 국회 사무처는 세부 내역 공개를 거부하고 있다.

2017101901_01

국회의원들이 정책자료집을 만들면서 베낀 원자료를 기관별로 분류했다. 국책연구기관 등 연구기관의 보고서를 베낀 의원이 13명(정책자료집 15건)으로 가장 많았다. 정부가 발주한 연구용역 보고서를 베낀 의원은 7명(정책자료집 7건)으로 집계됐다.

또 정부기관 등이 발표한 보도자료를 베낀 의원도 5명(6건)이었고 학위논문이나 학술지 발표 논문을 베낀 의원은 4명(6건), 언론 기고문 등을 베낀 의원도 1명이었다.

2017101901_02

해당 의원들은 다른 기관의 자료를 베끼면서 인용이나 출처 표기는 제대로 하지 않았다. 심지어 원 자료에 ‘출처 표기’를 명시한 문구도 있었지만 일부 의원들은 이를 무시했다. 표절은 물론 저작권 침해 의혹이 제기된다.

실제 저작권을 침해당한 원 저자들은 대부분 자신들의 연구성과가 도용당했다는 사실조차 알지 못했다. 또한 해당 의원실로부터 사전에 허락을 받은 경우는 거의 없었다.

이거는 제가 지금 처음 봐요. 왜냐하면 제가 관련된 보고서 같은 경우는 어지간한 건 제가 한 번씩은 다 보고, 적어도 내용은 안 보더라도 목차는 보고, 어느 보고서가 있다는 존재는 알고 있는데 이건 처음 보는 거 같은데요.

연구보고서 원 저자

뉴스타파는 표절 정책자료집을 만들고 국가예산을 받은 국회의원 25명의 명단을 홈페이지를 통해 공개한다. 또 20대 국회의원들이 발간한 천 2백여 건의 정책자료집 목록도 함께 공개한다. 뉴스타파는 또 19대 전직 의원들의 정책자료집 베끼기 실태에 대한 조사 결과도 앞으로 공개할 예정이다.

※ 20대 의원 191명 정책자료집 목록 보기


취재 최윤원, 박중석
촬영 김남범, 오준식
편집 윤석민
CG 정동우
그래픽 하난희
자료조사 정혜원, 김도희

목, 2017/10/19- 22:58
282
0

여론조사는 얼마나 정확한 것일까? 뉴스타파는 2014년 지방선거부터 2016년 총선까지 국내 여론조사기관들이 내놓은 선거 예측이 얼마나 정확했는지 분석했다. 그 결과 조사오차가 평균 9.6%p에 이르렀고 전체 중 36%의 조사는 당선을 맞추지 못하는 수준이었다.

여론조사 얼마나 정확하게 예측했나?

여론조사기관 ‘예측정확성’ 분석(수정오차 기준)

순위 조사기관명 조사 건수 당선자예측 성공률 단순 오차 수정 오차
1 한국CNR/케이엠조사연구소 7 71% 5.12 -6.61
2 현대리서치연구소 9 67% 3.94 -5.02
3 케이엠조사연구소 38 66% 5.85 -3.51
4 순천투데이(전남리서치연구소) 5 80% 6.10 -3.45
5 에이스리서치 10 70% 5.20 -2.85
6 폴스미스 14 79% 6.91 -2.59
7 중앙일보 조사연구팀/엠브레인 25 72% 8.84 -2.15
8 아이디인큐(오픈서베이) 9 33% 5.75 -1.82
9 한길리서치센타 75 65% 7.73 -1.70
10 한국CNR 11 73% 8.81 -1.69
11 큐리서치 5 60% 6.69 -1.69
12 한국리서치 60 65% 7.86 -1.52
13 마크로밀엠브레인 101 67% 8.46 -1.40
14 TNS KOREA 37 68% 8.13 -0.89
15 모노리서치 51 73% 8.69 -0.67
16 강원도민일보 부설 강원사회조사연구소 5 80% 7.94 -0.63
17 밀워드브라운미디어리서치 97 72% 8.80 -0.62
18 포커스컴퍼니 27 56% 9.27 -0.57
19 리서치앤리서치 126 58% 9.07 -0.23
20 중앙일보 조사연구팀 41 61% 9.42 0.15
21 조원씨앤아이 36 75% 9.73 0.18
22 유앤미리서치 18 67% 9.96 0.18
23 리얼미터 296 60% 9.77 0.19
24 휴먼리서치 13 62% 9.89 0.31
25 메트릭스코퍼레이션 8 50% 8.23 0.32
26 코리아리서치센터 130 62% 10.53 0.48
27 여민리서치컨설팅 20 50% 11.07 0.93
28 한국갤럽조사연구소 51 71% 10.65 1.05
29 비전코리아 5 60% 10.34 1.26
30 리서치플러스 31 61% 10.26 1.54
31 한국인텔리서치 11 73% 11.06 1.67
32 충청한길리서치 10 70% 12.08 1.82
33 대구한길리서치 7 71% 11.12 1.94
34 리서치뷰 21 62% 11.47 2.40
35 케이에스리서치 5 40% 11.42 2.86
36 폴리컴 5 80% 14.56 3.45
37 윈스리서치 19 68% 13.35 3.69
38 윈폴(WINPOLL) 15 53% 15.50 5.39
39 한백리서치연구소 6 33% 14.42 5.85
40 경기동부신문 5 60% 16.35 6.18
41 한국사회여론연구소(KSOI) 18 56% 17.31 6.68
42 좋은날리서치 5 100% 19.19 8.98
총합계 1,557 64% 9.55 0.00

▲ 분석대상과 기간: 2014년 지방선거 ~ 2016년 총선 사이 선거 예측조사

전체 분석대상 여론조사 1,557건의 단순오차는 평균 9.55%p로 나타났다. 즉, 여론조사들이 선거에서 1위와 2위 후보의 득표율 차이를 평균 9.55%p 잘못 예측한 것이다. 선거별로 단순오차를 보면 2014년 지방선거는 8.5%p, 2016년 총선은 10.6%p였다. 선거구가 작아질 수록 오차는 더 커지는 것으로 나타났다.

선거유형 조사 건수 단순오차
광역단체장 239 7.89
교육감 145 8.35
기초단체장 336 9.08
국회의원 837 10.41
총합계 1,557 9.55

1,557건의 여론조사 중 당선자 예측에 성공한 조사는 996건으로 예측 성공률은 64%였다. 36%인 561건은 당선자를 예측하는 데 실패했다. 당선자 예측에 실패한 조사의 단순오차는 평균 13.65%p로 나타났는데, 이는 당선자를 예측한 조사의 단순오차인 7.23%p보다 두 배 가까이 높은 수치다.

당선자 예측 여부 조사 건수 단순오차
성공 996 7.23
실패 561 13.65
총합계 1,557 9.55

단순오차를 기준으로 여론조사기관을 평가하는 데는 한계가 있다. 조사기관의 책임으로 볼 수 없는 요인들이 오차를 초래했을 수 있기 때문이다. 뉴스타파는 회귀분석을 통해 조사시점, 표본크기, 선거유형이 미치는 영향을 통제한 뒤 새로운 오차, 즉 수정오차를 계산했다. 수정된 오차를 기준으로 여론조사기관의 예측정확성 순위를 평가한 결과 메이저 여론조사기관이 중위권에 머물러서 회사규모가 크거나 전통이 있다고 더 정확한 것은 아닌 것으로 나타났다. 조사 건수가 296건으로 가장 많았던 리얼미터의 예측정확성 순위는 중위권인 23위였다. 오랜 전통을 가진 한국갤럽은 이보다 낮은 28위였다. 2015년 기준 리서치업계 매출액 1위인 칸타코리아의 전신인 TNS코리아와 미디어리서치는 각각 14위와 17위로 나타났다. 매출액 2위 한국리서치는 이보다 조금 높은 12위였다.

예측정확성 순위와 조사방법 사이의 관계도 살펴봤다. 유선전화 표집 여부와 자동응답시스템(ARS) 사용 여부에 따라 조사기관을 네 그룹으로 나눴다. 대부분의 조사를 유선전화를 대상으로 ARS만을 써서 조사하는 회사는 13곳이었는데, 예측정확도 순위가 가장 낮은 기관 10곳 중 6곳이 이 그룹에 속했다. 한편, 무선전화를 혼합해서 조사하는 비중이 상대적으로 높고, 전화면접 비중이 높은 회사는 18곳이었다. 예측이 가장 정확한 회사 10곳 중 6곳이 이 그룹에 속했다.

어떻게 분석했나?

1.오차란?

선거 여론조사가 실제 선거 결과를 얼마나 정확하게 예측했는지는 예측값과 참값의 차이로 평가할 수 있다. 여기서 예측값은 조사기관이 내놓은 지지율이 되고 참값은 실제 투표에서 얻은 득표율이 된다.

조사오차 = 예측값(여론조사 지지율) – 참값(선거 득표율)

2. 데이터 수집

지지율, 즉 여론조사기관들의 선거예측 데이터는 중앙선거여론조사심의위원회(여심위) 홈페이지에서 수집했다. 2014년 3월 여론조사 결과 등록 제도가 시행된 이후 2017년 4월 16일 현재까지 여심위 홈페이지에 등록된 조사건수는 3,396개였다. 이 가운데 선거일로부터 4주 이내에 조사된 여론조사는 모두 1,557건이었다. 여심위 홈페이지의 첨부파일을 열어 일일이 확인하는 수작업을 거쳤다. 득표율, 즉 실제 투표에서 각 후보가 얻은 득표율 데이터는 중앙선거관리위원회가 관리하는 선거통계시스템에서 가져왔다.

선거명 조사 건수
제6회 전국동시지방선거 705
2014년 상반기 재·보궐선거 54
2015년 상반기 재·보궐선거 26
제20대 국회의원선거 757
2016년 재·보궐선거 15
총합계 1,557

3. 단순오차

개별 후보들의 지지율과 득표율을 바로 비교하기는 어렵다. 여론조사에서는 ‘지지후보가 없다’는 등의 무응답이 있지만 실제 투표에서는 없기 때문이다. 이같은 문제를 해결하기 위해 학계에서는 후보간 지지율의 차이를 예측값으로, 같은 후보간의 득표율 차이를 참값으로 보고 그 차이를 계산해 여론조사의 정확성을 평가하는 경향이 있다. 뉴스타파는 선거에서 당선자와 2위 후보의 득표율 차이와 같은 후보들의 여론조사에서의 지지율 차이를 비교해 오차를 계산했다.

단순오차 = (선거 1, 2위 후보간 득표율 차이) – (여론조사 동일 후보 지지율 차이)


4. 수정오차

단순오차를 기준으로 여론조사기관을 평가하는 데는 한계가 있다. 여론조사기관의 책임으로 볼 수 없는 요인들이 오차를 초래했을 수 있기 때문이다. 대표적으로 고려되는 요인이 바로 조사가 이뤄진 시점이다. 선거일에 가까운 조사일수록 더 정확할 가능성이 높다. 또 선거 유형과 표본크기도 오차에 영향을 미치는 요인으로 알려져 있지만 조사기관의 책임으로 볼 수 없는 요인들이었다. 뉴스타파는 이 세 가지 요인이 오차에 미치는 영향을 통제하기 위해 회귀분석을 수행하고, 각 조사별로 잔차 값을 계산하는 방식으로 ‘수정오차’를 계산했다.

회귀분석의 종속변인으로는 ‘단순오차’, 독립변인으로는 조사일과 선거일 사이의 거리, 표본크기, 선거 유형이 사용됐다. 미국의 여론조사전문매체인 파이브서티에이트(FiveThirtyEight)이 적용해 공신력을 인정받은 방식이다. 조사업계와 학계에서 사용되는 다른 지표들과 비교한 결과 타당성에 문제가 없다고 판단했다.

※분석 결과에 이견이 있거나 개선사항을 제안하고 싶은 경우, 최문호([email protected]) / 김강민([email protected])에게 연락바랍니다.


취재: 최문호, 김강민, 최윤원, 연다혜
촬영: 김남범, 최형석
편집: 이선영
자료 입력: 김현우, 이수련

목, 2017/04/20- 18:57
282
0
「MBN-매일경제 여론조사에서 부산 북구·강서구갑은 박 후보가 41.8% 전 후보가 42.3%로 초접전 중인 것으로 나타났습니다. 」 「'반드시 투표하겠다'는 적극 투표 의향층에서도 박 후보 43.6%, 전 후보 47.9%로 4.3%포인트 차이에...
월, 2016/04/04- 09:07
281
0

지난 4월 개봉한 영화 <더 플랜>은 흥미로우면서도 매우 논쟁적인 주제를 담았다. 2012년 18대 대선에서 개표가 누군가에 의해 조작됐다는 것이다.

개표부정 의혹은 18대 대선이 끝난 이후 계속 제기돼 왔지만 그동안 제기됐던 개표부정 의혹과는 차원이 달랐다.

통계학자들이 등장해 각종 데이터를 분석한 결과를 보여주면서 조작이 아니면 설명할 수 없는 확실한 증거인 것처럼 이야기했다.

대통령 선거에서 개표조작이 있었다면 이는 국기문란이자 민주주의 파괴 행위다. 그럼에도 의혹은 정리되지 않은채 증폭됐다.

19대 대선이 끝나고 개표부정 논란은 잦아들었다. 그러나 앞으로의 대통령 선거에서 근소한 표차이로 당락이 결정되는 결과가 나온다면 개표부정이란 불씨는 또 같은 논리를 가지고 살아날 가능성이 높다.

뉴스타파는 그동안 제기된 개표부정 의혹을 풀어보기 위해 통계학자들에게 대선 데이터 분석을 의뢰하고 선관위 관계자들과 시민단체, 그리고 개표현장을 취재하며 하나하나 검증했다.

다음은 주요 내용을 정리한 것이다.

K값 1.5는 충분히 가능…미분류율의 차이가 K값 결정

영화 <더플랜>에서는 분류표에서의 후보간 득표율과 미분류표에서의 후보간 득표율이 같아야 한다고 주장했다. 이른바 K값이라고 설정한 이 비율이 1이 나와야 정상이라는 것이다.

18대 대선에서는 251개 선거구별 박근혜 후보와 문재인 후보간 K값 평균이 1.5였다. 사람이 개입하지 않고서는 나올 수 없는 결과라는 설명이 뒤따랐다.

2017070701_01

19대 대선에서 문재인 후보와 홍준표 후보간의 K값은 1.60이 나왔다. 문재인-안철수 사이의 K값은 1.24가 나왔다.

※관련기사 : 19대 대선 문-홍 K값은 1.6…정규분포

2017070701_02

이같은 현상에 대해 뉴스타파는 통계학을 연구하는 고려대의 박유성, 최보승 교수와 경기대의 이동희 교수에게 분석을 외뢰하고 자문을 구했다.

교수 3명 모두 K값이 1.5나 1.6이 나오는 것이 이상한 일이 아니라고 말했다. 후보마다 미분류율 차이가 있기 때문에 당연하다는 것이다.

18대 대선에서 박근혜 후보는 거의 모든 선거구에서 문재인 후보보다 미분류율이 높았다.

▲ 18대 대선에서의 후보별 미분류율. 일정한 비율을 그리며 거의 대부분 선거구에서 박근혜 후보의 미분류율이 문재인 후보보다 높게 나타난다.

▲ 18대 대선에서의 후보별 미분류율. 일정한 비율을 그리며 거의 대부분 선거구에서 박근혜 후보의 미분류율이 문재인 후보보다 높게 나타난다.

큰 미분류율을 작은 미분류로 나누면 1보다 큰 K값이 나온다.

19대 대선 때도 마찬가지로 후보간 미분류율에 차이가 있다.

▲ 19대 대선 후보별 미분류율. 홍준표-안철수-문재인-유승민-심상정 순이다.

▲ 19대 대선 후보별 미분류율. 홍준표-안철수-문재인-유승민-심상정 순이다.

후보별로 미분류율이 같다면 K값이 1이 나오지만, 미분류율이 다르면 K값은 1이 아닌 숫자가 나온다.

그런데 미분류율이 서로 다르게 나오는 것은 전혀 이상한 일이 아니다. 후보자 별로 지지집단의 인구학적 특성이 다르기 때문이다. 18대와 19대 모두 보수 후보의 미분류율이 진보 후보보다 높게 나타난 것을 확인할 수 있다. 후보마다 이처럼 미분류율의 차이가 무엇 때문에 발생하는 것인지 18대 대선 데이터로 확인했다. 18대는 선거구별로 연령별 투표율 자료가 수집돼 있다.

▲ 18대 대선 다중회귀분석 결과 박근혜-문재인 미분류 차이에 영향을 미치는 요인이 확인됐다.

▲ 18대 대선 다중회귀분석 결과 박근혜-문재인 미분류 차이에 영향을 미치는 요인이 확인됐다.

그 결과 보수에 대한 지지가 높은 곳일수록, 60대 이상 투표자가 많은 곳일수록 박근혜 후보와 문재인 후보의 미분류 차이가 커지는 것으로 나타났다. 20-30대 투표자가 많은 선거구에서는 미분류 차이가 줄어드는 것으로 나타났다.

이같은 분석 결과에 의하면 18대 대선 K값이 경상도에서 상대적으로 타지역보다 크고(경북1.65 경남1.83), 전라도에서 상대적으로 낮아지는 (전북 1.31 전남 1.34)이유가 설명된다.

60대 이상 투표자의 비중도 미분류율에 영향을 주지만 정치적인 성향도 영향을 준다는 것이다.

<정규분포>와 <출구조사 결과>는 조작이 없었다는 증거

뉴스타파와 인터뷰한 3명의 통계학과 교수는 18대 대선 때의 K값이 정규분포로 나타난 것은 조작의 증거가 아니라 오히려 조작이 없었다는 것을 보여주는 것이라고 해석했다.

또 18대와 19대 때 발표된 지상파3사 공동출구조사 결과는 최종 결과가 거의 일치했다면서 이 역시 개표조작설로는 설명할 수 없는 것이라는 입장을 내놨다.

19대는 미분류율이 낮은 후보가 당선…18대와 다르다.

취재과정에서 영화 <더플랜>에 출연했던 현화신 캐나다 퀸즈대 교수와 전희경 미 조지아서던대 교수는 뉴스타파의 질의에 “18대는 미분류율이 높았던 후보가 당선된 선거이고 19대는 미분류율이 낮은 후보가 당선된 선거”이므로 같다고 볼수는 없다고 밝혔다.

반면 출연자 중 한 명인 김재광 미 아이오와 주립대 통계학과 교수는 “19대 대선에서도 18대와 비슷한 K값이 나왔으므로 <더플랜>측이 지나친 의혹을 제기한 셈이 됐다”고 말했다.

※뉴스타파는 선관위로부터 입수한 19대 대선 전체 득표 데이터를 제공하고 통계 분석자료도 공개한다.


취재:최기훈, 김강민
촬영:정형민, 최형석, 김남범, 신영철, 오준식
그래픽:정동우
편집:정지성

금, 2017/07/07- 17:52
281
0
[여론조사결과] KBS·연합뉴스 20대총선 3-4차 판세분석 조사(통계표) ☞ 서울시 종로구 [PDF] ☞ 서울시... 여론조사 > 조사 의뢰 : KBS·연합뉴스 조사 기관 : (주)코리아리서치센터 지역·대상·크기 : 전국 6개 선거구 만...
금, 2016/04/08- 00:46
281
0