통계적 추론과 가설 검정
(1)모집단(population)과 표본(sample)
연구나 조사를 하는 경우에 그 대상이 되는 전체 집단을 모집단이라고 한다. 연구
나 조사를 정확히 하기 위해서는 모집단을 모두 조사해야 하겠지만 대부분의 경우
에는 모집단의 일부(일반적으로 1/10 이하)인 표본만을 조사할 수밖에 없다. 그 주
된 이유는 모집단을 모두 조사하려면 비용과 시간이 무척 많이 들기 때문이다. 모
집단으로부터 표본을 뽑는 방법을 표본추출방법(sampling method)이라고 한다. 통
계적 추론을 하기 위해서는 표본이 모집단의 성질을 잘 나타낼 수 있도록 뽑혀야
하는데 이를 위해서는 표본추출방법을 정확하게 사용해
야 한다.
(2)통계적 추론(statistical inference)
표본은 모집단의 아주 작은 일부이기 때문에 이 표본만을 가지고 모집단 전체에 대
해 정확히 알아낼 수는 없다. 그러나 표본추출절차를 정확하게 준수하여 표본을 뽑
으면 우리는 작은 오차 범위 내에서 모집단 전체에 대해 추측할 수 있다. 이러한
모집단에 대한 통계적 추측방법을 통계적 추론이라고 한다. 추론방법으로는 신뢰구
간에 의한 방법과 가설검정방법 두 가지가 있다.
신뢰구간(흔히 95% 신뢰구간)이란 모집단의 한 특성의 값을 신뢰구간 내에서 추
측하는 구간을 말한다. 그리고 가설검정은 모집단에 대한 가설을 세워 놓고서 이
가설이 옳거나 그르다고 추측하는 방법이다.
(3)가설 검정(Hypothesis Testing)
많은 통계분석 방법(T 검정, 분산분석, 회귀분석 등)에서는 가설검정방법을 통해 추
측을 한다. 가설검정에 의한 추측은 다음의 단계를 밟는다.
①가설
연구자는 귀무가설(H0로 표기)과 대립가서(H1으로 표기), 두 개의 통계적 가설을
세운다. 가설은 모두 모집단에 대한 기술이어야 한다. 예상하거나 새로 알아내고자
하는 명제를 대립가설(alternative hypothesis)로하고 대립가설에 반대되는 명제를
귀무가설(null hypothesis)로 설정한다. 귀무가설(영가설)은 흔히 ‘동일하다’, ‘차이가
없다’,등으로 표현된다.
대립가설은 연구가설, 목적가설이라고 부르기도 한다.
②검정통계량(test statistics)
가설을 검정하기 위한 통계량 값이다. T 검정통계량, X제곱 검정통계량, F 검정통
계량 등이 있는데, 이것은 표본 자료 값을 가지고 계산된다.
③p값(유의확률)(p-value, significance probability)
귀무가설이 참(true)일 경우, ②에서 계산된 검정통계량값이 얼마나 빈번하게 일어
날지에 대한 확률 값이다. 만약 p값이 작으면 귀무가설하에서 일반적인 현상이 아
니므로 귀무가설을 기각하고 연구가설(대립가설)을 채택하게 된다. 이 때의 기준으
로 유의수준 알파를 사용한다. 유의수준으로는 1%, 5%, 10%를 일반적으로 설정하
는데 이 중에서도 5%수준이 가장 널리 사용된다.
④결론
통계적 결론은 ‘H0를 기각한다’나 ‘H0를 기각할 수 없다’의 두 가지인데, 연구자는
통계적 결론을 바탕으로 연구의 결론을 내리게 된다. 즉, 표본 데이터에 의거해서
연구의 목적하던 바를 옳다고 받아들이거나, 받아들일 수 없다고 기술한다.