일단 제가 이해하기론 이렇습니다.
1)1.5의 숫자의 개념은?
A B C D E를 한통에 넣고 뽑는다면 비율적으로 각각 1/1/1/1/1의 확률을 가집니다.
이것을 100명의 사람들이 10000번 뽑습니다. 100명마다 조금씩 확률은 달라지겠지만
표본숫자가 커질 수록 1/1/1/1/1 의 비율이 나와야 합니다.
물론 사람마다 편차가 클수는 있지만 100명의 평균값을 내면 1/1/1/1/1 에 가까운 비율이 나오는게 통계적으로 자연스럽습니다.
그런데 A 혼자 1.5의 비율로 나왔고, 그것이 100명 모두에게 A만 1.5의 가까운 비율이 나타났습니다.
이것은 자연적으로 나타날 수 있는 숫자가 아니고 디자인된 숫자로 봐야 합니다.
2)중앙네트워크에서 발표한 시간과 개표소 발표시간 차이
더플랜에서 제시한 방송시간을 신뢰한다면,
중앙네트워크에서 발표한 시간이 개표소 발표 시간보다 선행되는 경우가 많았습니다.
이것은 제가 보기엔 해커 입장에서 보면 전국의 개표소 발표 시간이 각각 다를 수 밖에 없기 때문에 정확한 예측을 할 수 없으므로,
인구수 감안하여 발표시간을 임의적으로 셋팅해서 중앙네트워크에서 공개하다보니 타임랙이 발생한걸로 보여집니다.
이걸 보면 당시 출구조사에선 문재인이 앞섰다가 정작 개표 발표되고 나서 박근혜쪽으로 기울어진게 아귀가 맞게 됩니다.
선관위쪽에서 이 숫자에 대한 명확한 해명이 있지 않다면 곤혹 좀 치루게 되지 않을까 싶네요.
첫댓글 개인적으로 1.5 숫자보고 충격을 받았는데, 정규분포하면 1에 평균값으로 정규분포 곡선을 그려야 하는데, 통계적으로 말도 안되는 숫자라고 생각합니다.
다만, 궁금한게 수학적으로 표준편차가 얼마인지 알면 확률 계산이 가능할텐데, 그에 대한 내용이 없어서 개인적으로 아쉽더군요. 확률까지 계산해줬으면 좋았을텐데...
번개 2번 맞은 확률이라고 이야기하는 것만으로는 아쉽더군요. 정말 별도로 글 정리해보고 싶습니다.
표준편차라는게 이전 선거의 지역별 개표결과의 표준편차를 말씀하시는건가요?
아니면 저번 대선의 다른 후보들의 편차비율?
@조던황제 일반적으로 통계학적으로는 평균과 편차가 나오기 마련인데,
고등학교 수학의 짧은 상식으로는 정규분포를 표준정규분포로 바꾸면 신뢰수준을 결정할 수 있는 것으로 알고 있습니다.
문재인 박근혜 대선 결과를 해당 개표소별로 분석하면 신뢰수준 95%, 또는 99% 로 나눌수 있다고 생각됩니다.
1%의 확률로 나올 수 있는 결과가 200여개가 넘는 선거구에서 반복적으로 나온다면 이거는 확률적으로 말도 안된다는 거죠.
제 짧은 생각으로는 거의 모든 투표소가 1% 이하의 확률로 나온것으로 느껴지네요.
정신차려야 합니다~
제가 이제 궁금한 건 누가 했느냐입니다~!