Biostatistics | 유의확률(p-value) - Daum 카페

<p><span style="color: #333333;">통계패키지로 데이타를 분석하다보면 항상 나오는게 p-value입니다.</span></p><p><span style="color: #333333;"><br>많은 분들이 데이타 분석시 아래 정도만 알고계실겁니다.<br>p-value <= 0.05, 귀무가설 기각<br>p-value > 0.05, 귀무가설을 기각할수 없음.<br><br>매번 이렇게 결론을 내리다보면 찜찜하지요.<br><br>그럼 이 찜찜함을 해소해드리도록 노력해보겠습니다.<br><br>첫째, p-value는 확률입니다. 그러므로 (0, 1)의 값을 갖습니다.<br><br>둘째, p-value를 쉽게 설명하자면, 실험을 했건 설문조사를 했건 거기서 관찰된 데이타 또는 그것의 summary인 검정통계량(test statistic)이 귀무가설(H0)을 지지하는 정도입니다. 이 해석에 의하면 p-value가 작을수록 관찰된 데이타가 귀무가설을 지지하는 정도가 약해지므로 귀무가설을 기각하겠지요.<br><br>복잡한걸 싫어하시는 분은 여기까지만 아시면 되고요. 좀 더 알고 싶으신 분은 계속 읽어보세요.<br><br>셋째, p-value의 정확한 정의를 말로 써보면, 귀무가설이 맞다고 가정했을때 얻어진 검정통계량과 같거나 보다 더 극단적인 결과가 나올 확률입니다. </span><span style="color: #333333;">여기서 극단적이라함은 대립가설에 유리하게 나오는것을 의미합니다. 좀 어렵죠... 그래서 예를 들어보죠.</span><span style="color: #333333;"><br>1970년대에 한국 성인 남자의 평균키가 170cm이었는데, <br>2000년에 키의 평균이 증가했을거라고 주장하고 표본을 뽑아서 측정했더니 175cm였습니다.<br><br>그러면 가설이 어떻게 될까요.<br>H0: mu=170 vs Ha: mu > 170<br>이겠지요.<br><br>여기서 2000년에 측정된 표본평균 175가 검정통계량입니다.<br><br>검정통계량이 크면 클수록 귀무가설에 불리하고 대립가설에 유리하겠지요. <br>p-value가 검정톨계량이 관찰치보다 더 대립가설에 유리하게 나올 확률이라고했으니,<br><br>p-value= Pr(표본평균 >= 175) 입니다.<br><br>그런데 이게 다가 아니죠. 귀무가설이 맞다는 가정했을때라는 단서가 있으니<br><br>p-value = Pr(표본평균 >= 175 | mu=170) 입니다.<br><br>그런데 여기서 귀무가설이 맞다고 가정하고 구한 이유에 주목해야합니다.<br><br>표본평균의 표준오차를 1이라고 하면 <br>위의 확률을 구할때 "Z=(표본평균 - mu)/1=(표본평균-mu)"로 표준화시키겠죠.<br><br>p-value = Pr{ (표본평균-mu)/1 >= (175-170)/1 } = Pr(Z >= 5) = 0 <br>으로 p-value가 0입니다. <br><br>만약 관찰된 검정통계량이 175가 아니고, 귀무가설에 가까와서 170.5라고 하면 <br>p-value = Pr( Z >= 0.5) = 0.3085375 여서 꽤 큰 값이 나오지요.<br><br>짐작 되시겠지만 <br>귀무가설이 맞다고 가정함으로써<br>귀무가설을 기준으로 삼고 <br>관찰된 검정통계량이 귀무가설에서 지정한 값에서 확률적으로 얼마나 멀리 떨어져있나 보는것입니다.<br><br>멀리 떨어지면 p-value가 작아 대립가설을 지지하고,<br>가까우면 p-value가 커므로 귀무가설을 지지하겠지요.<br><br>참고) 양측검정의 경우 (Ha: mu is not 170)는 대립가설을 지지하는게 170으로부터 양쪽으로 멀어지는거죠. 그래서 175보다 큰 경우와 mu=170을 중심으로 정반대인 165보다 작은 경우도 동시에 고려해야합니다. p-value = Pr( 표본평균 > 175 or 표본평균 < 165 | mu=170) 입니다.<br><br>그래서 정규분포같이 대칭인 경우는 양측검정의 p-value는 단측검정의 p-value의 2배입니다.</span></p><p> </p><p> </p>

카페정보

Biostatistics

카페 전체 메뉴

▲

친구 카페

이전 다음

ㆍ 1차 정모

카페 게시글

목록 이전글 다음글

자료실 유의확률(p-value)

안재형 추천 2 조회 52,760 11.04.20 04:06 댓글 7

게시글 본문내용

다음검색

저작자 표시 컨텐츠변경 비영리

댓글

고감자
11.04.20 17:56

첫댓글 예전에 블로그에서 보던 그 글이네요. ^^; 이런 명쾌한 설명을...
안재형
작성자 11.04.20 19:34

감사합니다. 이제 한군데로 모으려고요.^^
강성찬
11.04.21 00:06

잘 보고 갑니다.^^
riveruns_thru_it
11.11.26 07:42

정말 잘 설명됐네요...
귀무가설을 지지하는 정도, 귀무가설이 맞다고 가정했을때 얻어진 검정통계량보다 더 극단적인 결과가 나올 확률
아주 이해하기 쉬웠습니다. 감사합니다.
crazyquery
12.12.13 10:09

이제 좀 이해가 가는군요 ^^ 감사합니다
홍해인
14.02.08 16:16

글 잘 봤습니다! 그런데 전 더 이해가 안 가는 부분이 생겨서 질문드립니다 ㅜ_ㅜ pvalue 너무어렵네요.. P값은 귀무가설을 지지하는 정도, 라는 말은 이해가 갑니다. 그래서 p값이 작으면 귀무가설을 기각하는것도요. 그런데 p값이 얻어진 검정통계량보다 더극단적인 값이 나올확률이다. 라는 개념이 이해가 안 가요 ㅜㅜ 극단적인값이 대립가설에 유리한 값이라면, 즉 귀무가설이 기각역에 속할 확률아닌가요? 전혀 상반되는 개념으로 이해가됩니다 도와주세요 ㅠㅠ
안재형
작성자 14.02.11 04:04

검정통계량이 대립가설에 유리할수록, 검정통계량보다 더 극단적인 값이 나올 확률은 적어집니다.

검색 옵션 선택상자

댓글내용선택됨 옵션 더 보기

댓글내용

댓글 작성자

최신목록