T-test나 F-test는 t-분포를 이용한, 혹은 F-분포를 이용한 가설 검정을 의미합니다. 그 가설은 모수(parameter)의 값에 대한 설정이고, 표본 자료로부터 모수의 적절한 추정치인 통계량(statistic)을 표본 자료로부터 계산됩니다. 이 통계량의 분포가 t-분포를 따르면 t-검정, F-분포를 따르면 F-test라 합니다.
통계 가설(statistical hypothesis)이란 우리가 관심을 갖는 집단(이를 모집단)의 특성(이를 모수: parameter)에 대한 설정입니다.
예를 들어, 신생아의 머리 크기에 관심을 갖는 경우 모집단은 새로 태어나는 아이가 되고, 측정치(자료)는 머리의 크기이며, 머리 크기가 측정된 신생아들의 머리 크기 평균이나 표준편차가 모수가 됩니다. 일반적으로 우리가 관심을 갖는 것은 모집단의 평균이 된다. 즉, 신생아들의 머리 크기의 평균은 어느 정도일까?
그러나 신생아 모두를 조사하는 것은 불가능하므로 그 중 몇 명의 신생아들을 선택하여 머리 크기를 측정하여 자료를 수집합니다. 선택된 신생아들을 표본(sample)이라 합니다. 표본 자료로부터 모집단 평균(모수)에 대한 적절한 추정치를 계산하게 되는데 이를 통계량이라 합니다. 모집단 평균에 대한 적절한 통계량은 당연히 표본 평균일 것입니다. (이런 상식적인 것들은 우리 통계학자는 수학적으로 증명하여 발표합니다) 표본 자료로부터 계산된 표본 평균을 이용하여 모집단 평균에 대한 가설을 검정하려면 표본 평균의 분포를 알아
야 합니다. 통계학 정리에 의하면 이 표본 평균의 분포 t-분포를 따르게 됩니다. 그러므로 표본 평균을 이용하여 모집단 평균에 대한 가설을 검정하는 경우 t-검정이라 합니다.
다른 예를 들어보죠. 미국 신생아 머리 크기와 한국 신생아 머리 크기에 차이가 있는지 알아보는 경우 가설은 한국 신생아 머리 크기 평균과 미국 신생아 머리 평균의 차이가 있는지 하는 것이다. 이런 경우를 두 모집단 평균 차이 검정이라 합니다. 모집단 신생아 머리 모두를 측정할 수 없으므로 한국 신생아 중 일부(표본) 머리 크기를 측정하고, 미국 신생아 들 중 일부의 머리 크기를 측정하게 됩니다. 한국 신생아 표본의 머리 크기 평균과 미국 신생아 표본의 머리 크기 평균이 적절한 통계량이 됩니다. 그리고 두 표본 평균의 차이를 이용하여 두 모평균의 차이가 있는지 검정하면 됩니다. 이 경우 두 표본 평균의 차이 역시 t-분포를 따르게 됩니다. 이 경우도 t-검정을 합니다. 이처럼 사용되는 통계량의 분포에 따라 t-검정, 혹은 F-검정이라 합니다.
일반적으로 생물 통계에서 F-검정이 사용되는 경우는 분산 분석(Analysis of Variance: ANOVA)일 것입니다. 가장 간단한 예로 감기약의 종류(A, B, C)에 따라 감기 바이러스 수가 차이가 있는가를 알아보는 경우 F-검정을 사용합니다. 가설(종류에 따른 차이는 없다)을 검정하는 통계량(MSR/MSE)이 F-검정을 따르게 때문입니다. 물론 감기 종류가 2개(A, B)인 경우는 두 모집단 평균 차이 검정과 같아지므로 표본 평균 차이 통계량에 의해 t-검정을 해도 되고 통계량(MSR/MSE)에 의해 F-검정을 해도 됩니다.
t-검정은 모집단 평균, 혹은 두 모집단의 차이를 검정하기 위한 것이고, F-검정은 모집단이 3개 이상인 경우 평균들의 차이를 검정(분산 분석)에 널리 사용 됩니다.
..