통계패키지로 데이타를 분석하다보면 항상 나오는게 p-value입니다.
많은 분들이 데이타 분석시 아래 정도만 알고계실겁니다.
p-value <= 0.05, 귀무가설 기각
p-value > 0.05, 귀무가설을 기각할수 없음.
매번 이렇게 결론을 내리다보면 찜찜하지요.
그럼 이 찜찜함을 해소해드리도록 노력해보겠습니다.
첫째, p-value는 확률입니다. 그러므로 (0, 1)의 값을 갖습니다.
둘째, p-value를 쉽게 설명하자면, 실험을 했건 설문조사를 했건 거기서 관찰된 데이타 또는 그것의 summary인 검정통계량(test statistic)이 귀무가설(H0)을 지지하는 정도입니다. 이 해석에 의하면 p-value가 작을수록 관찰된 데이타가 귀무가설을 지지하는 정도가 약해지므로 귀무가설을 기각하겠지요.
복잡한걸 싫어하시는 분은 여기까지만 아시면 되고요. 좀 더 알고 싶으신 분은 계속 읽어보세요.
셋째, p-value의 정확한 정의를 말로 써보면, 귀무가설이 맞다고 가정했을때 얻어진 검정통계량과 같거나 보다 더 극단적인 결과가 나올 확률입니다. 여기서 극단적이라함은 대립가설에 유리하게 나오는것을 의미합니다. 좀 어렵죠... 그래서 예를 들어보죠.
1970년대에 한국 성인 남자의 평균키가 170cm이었는데,
2000년에 키의 평균이 증가했을거라고 주장하고 표본을 뽑아서 측정했더니 175cm였습니다.
그러면 가설이 어떻게 될까요.
H0: mu=170 vs Ha: mu > 170
이겠지요.
여기서 2000년에 측정된 표본평균 175가 검정통계량입니다.
검정통계량이 크면 클수록 귀무가설에 불리하고 대립가설에 유리하겠지요.
p-value가 검정톨계량이 관찰치보다 더 대립가설에 유리하게 나올 확률이라고했으니,
p-value= Pr(표본평균 >= 175) 입니다.
그런데 이게 다가 아니죠. 귀무가설이 맞다는 가정했을때라는 단서가 있으니
p-value = Pr(표본평균 >= 175 | mu=170) 입니다.
그런데 여기서 귀무가설이 맞다고 가정하고 구한 이유에 주목해야합니다.
표본평균의 표준오차를 1이라고 하면
위의 확률을 구할때 "Z=(표본평균 - mu)/1=(표본평균-mu)"로 표준화시키겠죠.
p-value = Pr{ (표본평균-mu)/1 >= (175-170)/1 } = Pr(Z >= 5) = 0
으로 p-value가 0입니다.
만약 관찰된 검정통계량이 175가 아니고, 귀무가설에 가까와서 170.5라고 하면
p-value = Pr( Z >= 0.5) = 0.3085375 여서 꽤 큰 값이 나오지요.
짐작 되시겠지만
귀무가설이 맞다고 가정함으로써
귀무가설을 기준으로 삼고
관찰된 검정통계량이 귀무가설에서 지정한 값에서 확률적으로 얼마나 멀리 떨어져있나 보는것입니다.
멀리 떨어지면 p-value가 작아 대립가설을 지지하고,
가까우면 p-value가 커므로 귀무가설을 지지하겠지요.
참고) 양측검정의 경우 (Ha: mu is not 170)는 대립가설을 지지하는게 170으로부터 양쪽으로 멀어지는거죠. 그래서 175보다 큰 경우와 mu=170을 중심으로 정반대인 165보다 작은 경우도 동시에 고려해야합니다. p-value = Pr( 표본평균 > 175 or 표본평균 < 165 | mu=170) 입니다.
그래서 정규분포같이 대칭인 경우는 양측검정의 p-value는 단측검정의 p-value의 2배입니다.
첫댓글 예전에 블로그에서 보던 그 글이네요. ^^; 이런 명쾌한 설명을...
감사합니다. 이제 한군데로 모으려고요.^^
잘 보고 갑니다.^^
정말 잘 설명됐네요...
귀무가설을 지지하는 정도, 귀무가설이 맞다고 가정했을때 얻어진 검정통계량보다 더 극단적인 결과가 나올 확률
아주 이해하기 쉬웠습니다. 감사합니다.
이제 좀 이해가 가는군요 ^^ 감사합니다
글 잘 봤습니다! 그런데 전 더 이해가 안 가는 부분이 생겨서 질문드립니다 ㅜ_ㅜ pvalue 너무어렵네요.. P값은 귀무가설을 지지하는 정도, 라는 말은 이해가 갑니다. 그래서 p값이 작으면 귀무가설을 기각하는것도요. 그런데 p값이 얻어진 검정통계량보다 더극단적인 값이 나올확률이다. 라는 개념이 이해가 안 가요 ㅜㅜ 극단적인값이 대립가설에 유리한 값이라면, 즉 귀무가설이 기각역에 속할 확률아닌가요? 전혀 상반되는 개념으로 이해가됩니다 도와주세요 ㅠㅠ
검정통계량이 대립가설에 유리할수록, 검정통계량보다 더 극단적인 값이 나올 확률은 적어집니다.