위 내용을 삭제하지 마세요!!
(아래 선 아래에 글을 올리세요!!)
----------------------------------------
안녕하세요!
주변에 너무나 많은 분들이 제게 (직업상 30년째 데이터 업계에 종사 중) 물어보셔서 간단하게 샘플링 보정이 가능한 Linear Regression 선형회귀분석에 기반해 예측을 해보았네요. 일종의 Interpolation이라고 보면 됩니다!
전제: 유권자 정치 성향 별 비율은 대선 기간 동안 유지됨
이구동성으로 물어보신 것은 어떤 여론조사가 정확한 것인가?였는데 제 답변은 이거였고요!
답변: 다 맞음. 단, 한 가지 기준을 더해 보정을 해야함! (셀 가중 방식이 성별/연령대/지역 비율에는 적용됨! 따라서, 정치 성향 비율도 보정이 필요함!)
현재 중앙선관위에서 공표를 허용하는 여론 조사는 다음의 세 기준만 충족하면됨!
https://www.nesdc.go.kr/portal/bbs/B0000005/list.do?menuNo=200467
1. 성별 비율
2. 연령대 비율
3. 지역 비율
(행안부 주민등록 기준)
그런데 이 3가지만 충족하는 여론 조사는 심각한 Bias 편차를 야기할 수 있음.
따라서, 최소한의 정확도를 확보하기 위해서는
모수에 근접한 샘플링을 위한 기준 4가지가 필수!
1. 성별 비율
2. 연령대 비율
3. 지역 비율
그리고
4. 정치 성향 비율
1번 부터 3번 까지는 행안부 기준에 의해 셀 가중 방식으로 조사결과에 반영!
그러면 정치 성향은?
응답자의 정치 성향 비율은 질문의 내용 (예: 단일화 관련 질문; 무속 관련 질문 등) 지지층 그리고 활성화 정도에 따라 크게 영향을 받음.
조사 방법 (ARS/전화면접); 조사 요일; 조사 시간대; 콜백; 안심번호 vs. RDD; 유무선 혼합 비율 등에 의해서도 현저히 차이 발생!
띠라서, 정치 성향 비율을 반영한 비교적 간단한 공식을 제공하고자 한다!
기초 근거자료: KSOI & NBS 조사
KSOI 2월27일 공표 자료
NBS 주간 공표 자료
KSOI (ax+b) 0.967x+10.89
모수 가정 | 진보 성향 비율 | 보수 성향 비율 | 진보 - 보수 차이 | 지지율 차이 (이재명 - 윤석열) |
기본 전제 2 | 35 | 35 | 0 | 10.89 |
| 30 | 35 | -5 | 6.055 |
| 25 | 35 | -10 | 1.22 |
| 25 | 40 | -15 | -3.615 |
기본전제 1 | 40 | 30 | 10 | 20.56 |
기본 전제 3 | 45 | 25 | 20 | 30.23 |
기본 전제 4 | 30 | 40 | -10 | 1.22 |
NBS (cx+d) 0.37x+0.963
모수 가정 | 진보 성향 비율 | 보수 성향 비율 | 진보 - 보수 차이 | 지지율 차이 (이재명 - 윤석열) |
기본 전제 2 | 35 | 35 | 0 | 0.963 |
| 30 | 35 | -5 | -0.887 |
| 25 | 35 | -10 | -2.737 |
| 25 | 40 | -15 | -4.587 |
기본전제 1 | 40 | 30 | 10 | 4.663 |
기본 전제 3 | 45 | 25 | 20 | 8.363 |
기본 전제 4 | 30 | 40 | -10 | -2.737 |
KSOI기반 시뮬레이션 결과
진보 - 보수 차이 | 지지율 차이 (이재명 - 윤석열) |
0 | 10.89 |
1 | 11.857 |
2 | 12.824 |
3 | 13.791 |
4 | 14.758 |
5 | 15.725 |
-1 | 9.923 |
-2 | 8.956 |
-3 | 7.989 |
-4 | 7.022 |
-5 | 6.055 |
NBS기반 시뮬레이션 결과
진보 - 보수 차이 | 지지율 차이 (이재명 - 윤석열) |
0 | 0.963 |
1 | 1.333 |
2 | 1.703 |
3 | 2.073 |
4 | 2.443 |
5 | 2.813 |
-1 | 0.593 |
-2 | 0.223 |
-3 | -0.147 |
-4 | -0.517 |
-5 | -0.887 |
결론, KSOI기반일 경우는 10프로 이상 보수 성향 유권자가 더 많이 투표하지 않을 경우를 제외하고는 이재명이 이김.
NBS기반으로라도 진보성향 유권자가 3프로 이상 더 적지 않을 경우 이재명이 이김!
다음은 정치 성향 비율에 대한 4가지 시나리오임:
기본전제 1 | 비율 | 비고 |
진보성향 | 40% | 19대 대선 문재인 대통령 지지자 또는 현 국정지지도율 |
보수성향 | 30% | |
중도성향 | 30% | |
| | |
기본전제 2 | 비율 | 비고 |
진보성향 | 35% | 부동산 등 정책실패 및 정권교체 열망으로 인한 하락 |
보수성향 | 35% | 샤이보수의 적극적 전환 |
중도성향 | 20% | |
| | |
기본전제 3 | 비율 | 비고 |
진보성향 | 45% | 2018년 지자체 선거 직전 북미 정상 회담 등 평화조성 분위기 |
보수성향 | 25% | 태극기 등 극우이미지로 퇴색 & 수축 |
중도성향 | 30% | |
| | |
기본전제 4 | 비율 | 비고 |
진보성향 | 30% | 4.7보궐선거 구도: 10% 이상 투표 안함 |
보수성향 | 40% | 2007년 대선 구도: 근래 역대 최저 투표율. 진보성향 유권자의 대거 기권 |
중도성향 | 20% | |
해외는 이미 전화 걸어 (ARS건 전화면접이건) 조사하는 방식 더 이상 실시 안함!
앱 기반으로 응답자가 원할때 답변하게 함! (WhatsApp이건 Facebook이건 보편적으로 사용하는 앱에 Youtube의 단문 질의같은 설문을 Push로 노출)
대한미국에서는 이것이 불가하기에 최선의 여론 조사 방식은 다음과 같음:
1. 거짓말 못하는 (연령대/성별) 안심번호
2. 콜백 최소 3차례
3. 주말 또는 퇴근 시간 이후 포함
대선은 투표율이 제일 높은 선거!
그래서 샤이 표심을 읽으려면 이미 활성화된 적극 지지층의 여론 조사는 그냥 대세론 차원에서 쓰는 거고 실제 투표율을 들여다 보려면 최소한 위와 같이 설계된 조사 데이터 필수!
따라서, 위의 기준에 제일 부합하는 KSOI와 NBS의 Raw Data를 셀 가중 적용 후
4번째 기준인 진보/보수/중도 성향 비율로 보정해야만 실투표에 근접하는 데이터값이 구해짐!
NBS이건 어떤 조사이건
1. 단일화
2. 장모/부인 관련 질문
이런 거 섞인 대선 여론조사는 또 건너뛰어야 함!
추가 질문에 따라서 지지성향에 따라서 대통령 누구 뽑을 지는 답하고 추가 질문에서 겁나 많이 끊어 버림.
1번은 진보 성향이
2번은 보수 성향이
NBS가 단일화 그리고 방역관련으로 본 여론 조사 파트인 대통령 후보 지지 부문 외에 추가 문항이 오히려 더 길게 조사했더니
응답률 30%에서 10프로 대로 급락!
응답하다가 전화 끊어 버린 사람이 무려 2천명 가까이 발생.
평상시는 3천명 정도 컨택해 질의하면 1천명 채울 수 있는 데 그 주간은 무려 5천명 가까이 하고야 가까스로 1천명 채웠음!
이런 데이터는 걸러야 함!
2월28일 뉴스공장에서 공표한 KSOI가 동일일자에 안심번호 100프로로 콜백 해가면서
1. ARS
2. 전화면접
각 1천명씩 진행한 두가지 방식의 지지율 차이는 순위가 바뀌고 10프로 이상 차이가 났음!
그런데 이 두 조사 중 어느 하나가 틀린게 아님! 단지 특정 정치 성향이 과표집된 정도의 차이임!
ARS는 보수 과표집이 무려 9.4%! 보수 성향이 10프로 가까이 더 응답해 나온 결과치!
전화면접은 보수가 비교적 조금 덜 과표집되었음. 약 3.3프로 가량 더 많이 잡혔음. 진보 성향보다
위의 분석은 윤일화 (윤 + 안철수 굴복 대선 포기) 이전에 이루어 진것이며 이로 인해 역대급 역풍이 불었던 것은 고려치 않은 것임!
첫댓글 https://youtu.be/TMdiY44hedg
우와 인파인파
PLAY
이재명 후보가 반드시 승리합니다.내일의 태양은 새로운 태양이 뜰 것입니다.^^
단임보다 10년 20년 집권했으면 좋겠습니다.그래야 정책 일관성 있게 밀고 나가고
적폐도 확실히 정리해야 하니까요.
검찰 의사 악덕 노조 불량언론등등 싸악 청소해야합니다
친일도 깨끛하게
그렇게 되기를 바라고 기대합니다
초등수준의 모임이 있었죠.
얘기를 하는 수준이 꼭 60년대의 반공구호아래
때려잡자 김일성!
무찌르자 공산당!
이런 구호를 많이 외쳤을 겁니다. 더구나 일본잔재 친일파들에게 교육을 받아서
미제 군사정권을 거친 교육수준이라서 공산당 하면 목숨이 단번에 날아간
불행한 역사를 가졌기에 그 사회적 각인은 참으로 충격적이죠.
지금도 저런 부류의 출처불명의 유인물을 만들어서 표를 구하려고 하는
정당이 있다는 게 참으로 우리를 힘들게 하죠.
늘상 하는 얘기지만 생명체 개개의 객체는 기본 적으로 사회적 책임과 의무를
지지않는 생명을 지키려는 게 기본이라서 거기에 저항하는 모든 게 그 기본앞에
저항성이 없는 개인주의죠.
그런 기본입자들이 모이면 사회를 이루는 기본입자가 돼야 생명을 보장받습니다.
여기서 사회주의탄생이 기본이 되는 거죠, 그 기본을 위배하는 모든 것은 저항성을 잃어야
사회가 유지되고 집단이 가장 건강하게 존재하게 됩니다.
참으로 희한한 일은 이 사회주의를 거부하는 자들이 많다는 거죠.
사회주의를 하면 공산주의를 하는 거고 미제가 심어놓은 반공컴플렉스가
작동한다는 거죠.
이런저런 이유로 초등수준에서 멈춰버린 판단능력은 사회의 비웃음거리가 되죠.
10%이상 안정권에서 빙고합니다
시뮬레이션 결과 두 자릿수 이상 이길수도 있겠다고 생각했으나 생각 외로 구기득권의 사활을 건 특히 TK지역에서의 조직력이 살아나 그건 힘들어 보이네요!
검찰발 쿠데타 실패
로우 데이타 자체가 표본을 인위적으로 추출한 결과라서 그렇습니다.
https://youtu.be/N0Hb1Z2RZe4
(설문 조사를 어떻게 하는지 한 번 보세요.)
무작위 추출로 공평하게 여론 조사했을 때 A 후보 55%, B 후보 45% 지지율이 나올 때
B 후보 지지자 중에서 전체의 60% 표본을 추출하고 A 후보 지지자 중에서는 적게 40%를 추출해서
다시 여론 조사하면 B 후보 지지율이 더 높게 나오지요.
PLAY