안녕하세요?
갑작스럽고 뜻하지 않게 제가 리뷰를 하게 되서 질문 올립니다.
일단 리뷰하라고 온 논문은 판별분석을 사용한 것입니다
그런데 저는 배울 때도 그렇고 판별분석이 있다 정도로만 하고
로짓이나 프로빗 모형을 사용 하라고 가르치던 분들이 다들 하셨습니다.
제가 아는한 판별분석은 독립변수들이 연속변수 형태여야 하고(간혹 어떤 책을 보니
더미 변수도 들어갈수 있다는데...이게 맞는지요?)
모두 정규분포를 엄격히 지켜야하고.. 제약이 많아서 사용을 잘 하지 않는다고 했는데...
읽어본 몇 편의 논문들 중에서도 둘이 비교한 결과 (판별 분석과 로지스틱)
독립변수가 정규분포 형태가 안지켜질때는 로지스틱이 예측정확도도 우수하고
지켜진다 하더라도 로지스틱이 우수하다고들 하는데...
그럼에도 불구하고 판별분석을 쓰는 제가 알지 못하는..
로지스틱 회귀분석류를 뛰어넘는 특별한 이유가 있는지요?
그래서 꼭 판별분석을 해야하는 경우가 있는지요?
추가로 샘플링이 군집 분석 방법을 사용했을 때 판별분석에서
보정을 할 수 있는지요?
감사합니다.
첫댓글 ?판별분석은 제가 아는 분야는 아니어서 답변드리기가 힘드네요. 작년에 뱅쿠버 통계학회에서 다변량 short course를 들었는데 판별분석을 logistic regression으로 하고, 다른건 소개 안하던데요. 이름은 까먹었지만 강사가 유명한 책 저자였는데 logistic regression으로만 한걸 보면 그게 현재 트랜드가 아닌가합니다.
예~논문 저자한테 판별분석을 한 특별한 이유를 물어보는걸로 해야겠습니다~로지스틱이랑 비교해봤냐 물어보고요~감사합니다.
판별분석에서 요구되는 가정(assumptions)이 로지스틱 회귀분석보다 엄격합니다.