• Daum
  • |
  • 카페
  • |
  • 테이블
  • |
  • 메일
  • |
  • 카페앱 설치
 
카페정보
Biostatistics
 
 
 
 

친구 카페

 
 
카페 게시글
책: R을 이용한 누구나 하는 통계분석 (질문) 회귀진단
cardiomoon 추천 0 조회 273 11.02.14 23:53 댓글 8
게시글 본문내용
 
다음검색
댓글
  • 11.02.15 00:27

    첫댓글 sqrt-변환이 훨씬 좋아보이기는 합니다. 그런데 NTAV를 sqrt-변환할 수 있는 정당성이 있으면 완벽할 것 같은데요. log-변환도 해보셨나요? 그런데 데이타를 보면 뭔가 age이외에 다른 설명변인이 더 있을것같은데요. 그리고 데이타 cars에서는 거의 mechanistic해서 절편을 제거했는데 이 경우 절편을 제거하는게 논리적으로 그럴듯하지만 나이로 모든게 설명되지 않으니 왠지 찜찜한데요^^

  • 11.02.15 00:32

    cor.test(sqrt(NTAV),AGE-1) 에서 "AGE-1"은 그냥 AGE를 넣은것이나 동일합니다. 회귀분석에서 "-1"은 절편을 제거하라는 일종의 신호이고, cor.test에 -1을 넣으시면 계산에서 AGE에서 1을 뺍니다. 83페이지 식을 보시면 데이타에서 평균을 빼므로 어떤 숫자를 더하건 빼건 공분산과 상관계수의 값은 동일합니다.

  • 11.02.15 01:00

    그래프를 보니 화면을 capture하셨나요? R에 File > Save as 에서 그림을 저장할 수 있습니다.

  • 작성자 11.02.15 07:48

    네 다른 변인도 많이 있읍니다. 동맥경화를 일으키는 위험인자는 나이, 성별(남자), 흡연, 당뇨, 고혈압, 콜레스테롤 등 여러가지가 있을 수 있읍니다. 그래서 multivariate analysis를 했는데요, 남자, 고혈압, 당뇨 등이 유의하게 나왔읍니다. 정당성이 있느냐 하시는데 나이와 동맥경화 정도가 linear regression하는 것보다는 나이의 제곱에 비례한다는 것이 더 그럴듯하게 들리는데요. 통계적으로 어느 것이 더 적합한지만 알면 주장할 수 있을 듯 한데요.

  • 11.02.15 10:57

    전문가께서 나이 제곱이 더 그럴듯하게 들리신다면 그게 맞겠죠. 통계적으로는 제곱이 더 나아보입니다. 다른 변인들도 있다면 다중회귀분석(multiple regression)을 하시는게 나올것같은데요.

  • 작성자 11.02.15 07:52

    책쓰셔서 R의 길로 인도해주시고 통계에 우매한 저같은 사람들통계 상담도 해 주시고 고생이 많습니다. ^^
    cor.test에서는 -1을 쓰는 것이 아니군요.. 감사합니다. 맥용 R에서는 save as메뉴에서 pdf로 저장되더군요. pdf를 올릴수 있는지 몰라 그냥 캡쳐했읍니다. 물론 그림도 만들줄 아는데요.그냥 편의상 캡쳐했읍니다.

  • 작성자 11.02.15 08:11

    그리고 또한가지 질문, r-value가 0.17인데 N 수는 115명입니다. R 값이 너무 작은 것 아닌가요? 의의를 둘수 있을까요?

  • 11.02.15 10:57

    변수 하나로 그정도면 작은 것 같지는 않습니다. 다른 변수를 추가하면 R-square값이 높아질겁니다.

최신목록