통계의 덫, 여론조사 제대로 보자
어느 통계 조사에서 66.7% 찬성이 나왔다고 가정해 보죠. 반을 훨씬 넘겼으니 찬성 여론이 참 높다고 받아들이겠지요. 내용을 더 들여다봅니다. 저 비율이 3명을 조사하여 2명 찬성한 결과라면, 이게 뭐야 하겠지요. 분모를 늘려보죠. 30명, 300명, 3,000명 나아가 조사한 숫자가 30,000명이라면 어떻게 받아들이겠습니까? 여론을 반영할 만큼 큰 수를 조사한 것이 아니면 조사 결과는 의미가 없습니다(큰수의 법칙, 아래 설명 참조). 이처럼 여론조사는 범위, 대상, 전문 분야에 따라 믿음 정도가 달라집니다. 통계 조사 내용을 자세히 따져봐야 합니다. 언론에 보도되는 기사 제목에는 조사 결과만 나옵니다. 전체 기사를 읽지 않으면 제목에 휘둘립니다.
대통령 선거를 앞둘 때면 후보자 지지율 조사가 쏟아져 나왔습니다. 여론조사한 세부 내용을 보면 대략 천 명 남짓 조사하여 소수점 1~2자리로 발표했습니다. 천 명에서 1명은 0.1%입니다. 유권자 4천여 만 명인데 겨우 천 명 조사하여 지지율 오르고 내리고를 0.1% 단위로 발표하는 게 무슨 의미가 있습니까? 그럼에도 등락률을 소수점 1자리까지 발표하더군요. 총 유권자의 1%인 40만 명, 아니면 0.1%인 4만 명, 하다못해 4천 명 정도는 조사하여 동향이 이렇다고 해야 통계에서 큰수의 법칙에 조금이라도 더 다가갈 텐데요. 천 명 가량 조사해 놓고 전체 여론인 듯이 발표합니다.
건설 분야에서 토목은 센티미터, 건축은 밀리미터를 잣대로 본다고 합니다. 분야의 특성으로 볼 때 의미 있는 단위입니다. 만약 기준 단위가 마이크로미터, 나노미터 단위를 다루는 영역에 대하여 토목이나 건축기술자에게 의견을 물어도 별 의미가 없다는 뜻입니다. 이는 토목건축 기술자를 무시하는 것이 아니라, 더 정밀한 분야에 대한 정책을 마련할 때 그 분야에 전문 지식을 가진 전문가를 대상으로 의견을 구하지 않으면 엉뚱한 결론을 얻게 될 위험이 많기 때문입니다. 예전 노무현 전 대통령은 전문가는 자기 분야에 사로잡혀 창의력이 없으므로 그 분야 전문가에 의견을 구할 필요가 없다는 뜻으로 말한 것이 기억납니다. 아닙니다. 제게 나노기술을 개발 방향에 대한 질문을 받으면, 모른다, 관심 없다고 대답합니다. 무응답 비율로 분류되겠지요.
의대 증원 문제를 바라보는 국민여론을 묻는 여론조사가 자주 나옵니다. 한국경영자총협회(경총)가 21일 ‘2024 국민건강보험 현안 대국민 인식조사’ 결과를 발표했습니다. 의대생 증원, 필수 의료 정책, 건강보험료 수준을 조사했는데 ①겨우 1,023명 조사로 대수의 법칙이 작용하기 어렵고, ②조사 모집단도 의료분야 지식이 있거나 종사하는 사람, 적어도 환자와 그 가족을 위주로 조사했어야 하는데고 그런 것 같지 않고, ③ 의사 수 늘어나는 것과 건강보험료 인상은 같이 고려하여 판단할 문제인데 각각 쪼개 묻고, 쪼개 물은 결과만 발표하니 ‘의대 증원 찬성’과 ‘의료비 추가 부담 반대’로 결과가 정리됩니다. 국가가 돈 나눠주는 것은 찬성하지만 세금은 더 내기는 싫다는 모순에 빠집니다. 의대 증원하면 건강보험료가 오릅니다. '의대생 2,000명 증원하면 의료비를 더 부담해야 합니다. 그럼에도 찬성합니까?’로 물었으면 결과가 어땠을까요?
전문 분야이고, 시간이 오래 걸리고, 돈이 많이 들어가는 정책일수록 조심스럽게 접근해야 합니다. 정책을 잘못 꿰면 나쁜 것이 좋은 것을 몰아냅니다. 어렵사리 정립된 제도더라도 무너지기 쉽고, 무너진 것을 다시 세우려면 시간이 오래 걸리고, 다시 세울 수 있을지도 의문입니다. 여론조사는, 특히 큰수의 법칙을 무시한 여론조사는 ‘그렇게 생각하는 사람이 있구나’하는 정도로 받아들이는 게 좋겠습니다. 어느 사람은 ‘해당 분야을 알지 못하는 사람 만명의 의견에는 귀 기울일 필요없다!’고 단정하여 말하더군요. 재미 삼아 조사한 것이 나라 정책의 물꼬를 바꾸는 근거가 되지 않아야 합니다.
설마 대한민국 정부가, 정책을 선무당식으로 결정하지 않겠지요? 정책이 시행되더라도 잘못이 발견되면 얼른 고치는 게 현명합니다. 잘못된 것을 밀어 붙이면, 더 큰 재앙이 됩니다.
* 큰수(대수)의 법칙:
큰수의 법칙은 "무작위 사건을 반복적으로 시행할 때, 시행 횟수가 증가할수록 결과의 평균은 실제 확률에 가까워진다"는 것을 의미하는 통계 개념입니다. 큰수의 법칙은 ①무작위 추출(표본이 모집단에서 무작위로 추출되어야 함) ②독립성(각 표본 값들이 서로 독립적이어야 함) ③유한 분산(모집단의 분산이 유한해야 함) 조건이 충족되어야 합니다. 이 조건을 만족하지 않으면 법칙이 적용되지 않을 수 있으며, 그러면 표본 평균이 모집단 평균과 크게 다를 수 있습니다.
(인공지능에게 물어 나온 답을 편집했습니다.)
|