아래 로지스틱 회귀 - odds ratio 해석 추가질문입니다.
알려주신대로 그래프를 그려보니 첨부한것처럼 나오는데요, 이것을 어떻게 해석해야할까요? 30점일때 1년이상 생존할 확률이 40%라고 해석해야할까요? 이렇게 생각하기엔 점수 1당 1.035배 생존율이 높아진다는 해석과 그래프가 조금 맞지 않는 것 같아서요.
답변 해주시면 정말 감사하겠습니다.
아래 질문드렸던 본문 첨부드립니다.
--------------------------------------------
안녕하세요.
R을 이용한 누구나하는 통계분석으로 공부하다가,
처음으로 실제 데이터를 가지고 돌려보았습니다.
1. 로지스틱 회귀 - odds ratio 해석방법 문의
독립변수는 "1~100까지 점수"이고,
종속변수는 1년이내 사망은 0, 1년이상 생존은 1입니다.
out= glm(종속~독립,family=binomial)
summary= out 하니까
p값 0.0396 * 이고
exp(coef(out)) 결과가 1.0353802 입니다.
odds ratio가 1.0353802니까
점수가 1올라갈때마다 1.0353802배 생존율이 커진다고 해석하면 될까요?
처음 돌려본 통계라, 이렇게 해석하면 되는건지 불안하네요.
위 odds ratio 해석은 R을 이용한 누구나하는 통계분석 187p하단에 있는
"산모의 몸무게(lwt)가 1증가하면 신생아 저체중의 odds는 0.9838068배 증가"라는 내용이
제 데이터에 해당하는 것같아 참고했습니다.
2. "1~100 점수"로 1년이내 사망할지 1년이상 생존할지 예측 가능 유무
이 데이터를 로지스틱 회귀분석하는 것이 맞는지 확신이 없어서,
상관분석과 단순회귀분석을 해보았는데요
cor=0.14 나오고 Adjusted R-squared=0.015 나오더라고요.
네이버 좀 찾아보니까 상관도랑 R제곱값 모두 너무 낮다고 나오더라고요.
그러면 "1~100점수"로 1년내 사망할지 생존할지를 예측하는 것은 의미가 없을까요?
알려주시면 정말 감사하겠습니다.
첫댓글 odds는 p/(1-p)입니다. 말로하기 번거로우니 대충 생존률이라고 하는데, 정확히 하자면 생존률(p)과 죽을 확률(1-p)의 비입니다. p가 작다면 (1-p)가 1에 가까우니 p/(1-p)는 대충 p하고 비슷합니다. 그러나 p가 좀 커지면 점점 거리가 멀어집니다.
대충 그래프를 보니 30일때 p=0.4, 70일때 p=0.7쯤 되는듯합니다. 이 둘의 odds ratio를 구하면 (0.7/0.3)/(0.4/0.6)=3.5입니다. 70하고 30의 차이가 40이니 1.03538^40=4.0178이네요. 이게 3.5와 같아야하는데fitted(out)하면 나오는 값으로 일치하나 시도해보세요.
감사합니다. 이제 이해가 가네요. ^^
첫댓글 odds는 p/(1-p)입니다. 말로하기 번거로우니 대충 생존률이라고 하는데, 정확히 하자면 생존률(p)과 죽을 확률(1-p)의 비입니다. p가 작다면 (1-p)가 1에 가까우니 p/(1-p)는 대충 p하고 비슷합니다. 그러나 p가 좀 커지면 점점 거리가 멀어집니다.
대충 그래프를 보니 30일때 p=0.4, 70일때 p=0.7쯤 되는듯합니다.
이 둘의 odds ratio를 구하면 (0.7/0.3)/(0.4/0.6)=3.5입니다.
70하고 30의 차이가 40이니 1.03538^40=4.0178이네요. 이게 3.5와 같아야하는데
fitted(out)하면 나오는 값으로 일치하나 시도해보세요.
감사합니다. 이제 이해가 가네요. ^^