안녕하세요
다중회귀분석 수행단계 전 의문사항이 생겨 질문을 올립니다.
일단 자료는 y변수, x변수에 대한 구분을 마친 상태입니다
1. x변수 간 다중공선성(multicollinearity)을 보고자 하는데요
문제는 x변수 5개 중 3개가 categorical data라는 것입니다.
일반적인 자료의 경우라면 VIF를 통해 다중공선성을 체크할 수 있을텐데
categorical data의 경우 다중공선성을 어떻게 확인해야 할 지 감이 잘 잡히지 않습니다.
2. 위에도 언급했듯이 x변수 5개 중 3개가 categorical data인데요
categorical data의 경우 dummy 변수를 사용하여 회귀 분석을 해야 한다고 판단하고 있습니다.
제가 찾아본 더미변수 관련 예제의 경우, 대부분 단순 회귀와 관련된 예제인데요
여러개의 categorical data를 각각 dummy 변수를 사용하여 다중회귀분석을 수행해도 될까요?
궁금한 점이 참 많으나...일단 제일 궁금한 것에 대해 질문을 드립니다.
현명하신 분들의 빠른 답변 부탁드립니다. 계속 고민하고 있는데, 진행이 잘 안되어서 너무너무 답답하네요
감사합니다
첫댓글 다중로지스틱 분석이 적합해 보일 듯 합니다. 다만, 종속변수가 범주형이라는 가정하에서 진행되는 통계분석으로 독립변수들이 연속형과 범주형이 모두 포함될 수 있습니다.
통계사랑님, 답변 감사드립니다. 그런데 제 자료는 종속변수가 연속형입니다. 이 경우 다중로지스틱 분석은 불가능하지 않을까요?
질문 한가지 더 드리겠습니다. 범주형 변수인 독립변수 간 다중공선성(multicollinearity)은 어떻게 테스트 해야 하나요? 연속성 변수에 사용하는 VIF를 통해 측정하는 것은 불가능해 보이는데, ANOVA를 사용해야 할까요?
감사합니다
범주형 변수의 다중공선성은 상관분석으로 대체하시면 됩니다.
그리고, 독립변수가 범주형과 연속형이 혼합되어 있으므로 ANCOVA(공분산분석)도 적용 가능합니다.