• Daum
  • |
  • 카페
  • |
  • 테이블
  • |
  • 메일
  • |
  • 카페앱 설치
 
카페정보
Biostatistics
 
 
 
 

친구 카페

 
 
카페 게시글
묻고 답하기 단순회귀분석에서 잔차가 정규분포를 따르는지 shapiro.test를 하였는데 p-value가 1.37e-16 나온 결과에 대한 문의(초보)
황욱 추천 0 조회 731 17.12.30 04:27 댓글 8
게시글 본문내용
 
다음검색
댓글
  • 17.12.30 11:15

    첫댓글 어차피 simulation된 데이터가 아니면 정규분포 가정을 완벽하게 만족시키는 건 없습니다. 정규성 검정은 표본 크기가 클수록 작은 차이에도 민감하게 반응합니다. qqplot 보시면 왼쪽 아래 뭔가 특이한 값이 있어보입니다. 그걸 넣을지 뺄지 결정하면 회귀분석 자체는 큰 문제가 없어 보입니다.

  • 작성자 17.12.30 12:30

    감사합니다

  • 17.12.30 23:44

    식을 보면 y=a+b*x+error에서 error가 정규분포를 따른다는 가정이죠. 정규분포가정은 회귀식의 정당성하고는 상관없습니다. 대신 추정에서 나온 검정통량들이 정규분포의 부산물인 t, F-분포를 따르지않습니다. 그래서 거기서 얻어진 p-value가 정확하지않습니다.

  • 작성자 17.12.31 09:13

    유용하게 책 잘 보고 있습니다. 단순회귀분석 98페이지에 나와있어 지식이 없다보니 꼭 필요할 것인줄 오해했습니다 ---------감사합니다

  • 17.12.31 13:11

    @황욱 보통 예측(prediction)만 하는 경우에는 회귀식만 있으면 되므로 정규분포가정이 필요없습니다. 그런데 가설검정을 하고 p-value를 구하려면 검정통계량의 분포를 알아야하므로 정규분포가정이 필요합니다.

  • 작성자 17.12.31 14:30

    @안재형 예 알겠습니다 감사합니다.

  • 18.01.03 18:19

    사실 perfect collinearity만 없다면 회귀계수 도출에는 아무런 문제가 없습니다. ((X'X)^-1 만 존재한다면)
    나머지 가정은 적합도, unbiased, consistency, inference 문제가 발생합니다.

  • 작성자 18.01.05 11:26

    감사합니다

최신목록