1. 목적
이분형(예/아니오) 종속변수에 대하여 한 개 이상의 설명(독립)변수들을 가지고 회귀모형을 만든다.
로지스틱 회귀분석(Logistic Regression Analysis)은 존재(1)/부재(0) 형태로 되어 있는 종속변수에 대하여, 한 개 이상의 설명(독립)변수들을 가지고 이를 추측하기 위해 회귀분석을 하는 것이다. 일반적인 회귀분석과 유사한데, 종속변수가 구간 비율척도 변수가 아니라 0과 1의 값을 가지는 이분형 범주형 변수라는 것이 다른 점이다. 또한 로지스틱 회귀분석에서는 회귀계수로 독립변수들의 오즈비(odds ratio)를 쉽게 구할 수 있는 장점이 있다.
종속변수가 범주형 변수라는 점은 판별분석과 동일하지만 독립변수들이 다변량 정규분포를 따르지 않아도 되기 때문에 판별분석 보다 덜 제한적이어서 다양하게 사용할 수 있다.
로지스틱 회귀모형에는 종속변수 값이 0과 1의 두 가지인 이분형 로지스틱 회구모형과 세 개 이상의 값을 가지는 종속변수에 대한 다항 로지스틱 회귀모형이 있다. 여기서는 이분형 로지스틱 회귀모형 만을 설명하기로 한다.
2. 사용되는 변수의 척도
독립변수는 범주형 변수나 구간 비율척도이고 종속변수는 0과 1의 두 가지값을 가지는 이분형 범주형 변수
로지스틱 회귀분석에서 종속변수는 0과 1을 가지는 이분형 범주형 변수 이어야 하다. 독립변수는 범주형 변수와 구간 비율척도를 모두 사용할 수 있다. 더미변수(dummy variable) 형태가 아닌 범주형 독립변수의 경우에는 대화상자에서 범주형 단추를 눌러서 범주형 변수인 것을 지정해야 한다.
3.원리
(1)로지스틱 회귀분석에서의 가정(assumption)
로지스틱 회구분석을 실행시키기 위해서 판별분석과 같은 분포의 가정은 필요하지 않다. 그러나 독립변수들이 다변량 정규분포를 따르면 추정 결과가 보다 안정적이다. 회귀분석에서와 같이 독립변수들 사이에 다중 공선성이 있는 경우에는 추정에 편의가 생기고 큰 오차가 발생한다.