1. 목적
한 개나 두 개 이상의 요인에 의해 집단들의 평균을 비교할 때, 종속변수에 영향을 주는 다른 구간 비율척도 변수들을 통제하고자 한다.
요인이 한 개인 일원배치 분산분석이나 요인이 두 개 이상인 단순요인 분산분석을 사용해서 요인들의 효과를 검정할 때, 알아보고자 하는 요인외에 다른 변수(제3의 변수라 하자)가 종속변수에 영향을 미치는 경우가 있다. 이런 경우에는 영향을 주는 제 3의 변수들의 효과를 통제해야 알아보고자 하는 요인들의 효과를 정확하게 추정할 수 있다. 제 3의 변수가 범주형 변수라면 단순요인 분산분석에서 이 변수를 모수요인이나 변량요인에 추가해서 분석을 하면 되지만, 제 3이 변수가 구간 비율척도라면 공분산분석으로 이 변수의 효과를 통제할 수 있다. 이 구간 비율척도 변수를 공변량(covariate)이라고 한다.
공분산분석은 이런 공변량을 모형에 포함시켜서 공변량의 효과를 통제한 상황에서 요인(집단)변수 효과를 검정하는 분석이다. 결과적으로, 공분산분석은 분산분석 모형에 회귀분석 모형을 합한 모형에 대한 분석이라고 하겠다.
예를 들어, 30명의 여성을 대상으로 세 가지 다이어트방법의 효과를 알기 위하여 완전랜덤계획법으로 실험했다고 하자. 이때 종속변수는 다이어트 과정 후에 체중감소량(초기체중-과정후 체중)이고 요인은 세 가지 다이어트 방법이다. 그런데 일반적으로 초기체중이 큰 사람은 다이어트 방법에 관계없이 체중 감소량이 클 것이고 초기체중이 작은 사람은 다이어트 방법에 관계없이 상대적으로 체중감소량이 작을 것이다. 즉, 초기체중이 종속변수(체중감소량)에 영향을 줄 것이라고 생각된다. 따라서 초기체중을 공변량으로 하여 먼저 통제한 다음에 요인의 효과를 계산하는 것이 연구 목적에 더욱 합당하게 된다.
2. 사용되는 변수의 척도
종속변수는 구간 비율척도이고 모든 요인변수는 명목이나 순서척도이며, 공변량은 구간 비율척도
위에서 예를 든 세 가지 다이어트 방법의 효과 연구에서는 종속변수가 체중감소량, 한 개의 요인변수가 다이어트 방법(3 수준)이고 공변량이 구간 비율척도인 초기체중이 된다.
[참고]
1.공분산분석을 하기 전에 모형에서 집단별 공변량의 회귀계수가 같은지를 먼저 검정해야 한다. 이를 위해서는 먼저 대화상자에서 ‘모형’ 단추를 눌러 모형 대화상자로 들어간다. 여기서 사용자 정의를 사용해서 주요인과 요인-공변량 간의 상호작용 항을 모형에 넣는다. 이 모형을 실행시켜서 상호작용고 효과의 유의성 검증을 한다. 공분산분석을 적절하게 사용하기 위해서는 상호작용 효과의 검증을 한다. 공분산분석을 적절하게 사용하기 위해서는 상호작용 효과의 검정에서 귀무가설을 기각하면 안 된다.
2.공변량의 유의성 검증에서 반드시 귀무가설이 기각되어야 한다. 만약 귀무가설이 기각되지 않으면 공분산분석 대신 분산분석을 해야 한다.