😊두 집단간의 비교 T 검정😊 - 주제: 식후 산책이 식곤증에 영향을 미치는가? (유의수준: 5%)
[ 가상의 데이터 ]
- 그룹 1 (산책 후 식곤증 측정값): 식후 산책을 한 사람들의 식곤증 정도 (예: 1-10 스케일로 평가)
- 그룹 2 (산책하지 않은 후 식곤증 측정값): 식후 산책을 하지 않은 사람들의 식곤증 정도 (예: 1-10 스케일로 평가)
1. 식후 산책한 그룹
- 샘플 크기( n₁) = 30
- 평균 식곤증 점수 ( μ₁) = 4.2
- 표준편차 ( σ₁) = 2.5
2. 식후 산책하지 않은 그룹
- 샘플 크기( n₂) = 30
- 평균 식곤증 점수 ( μ₂) = 6.5
- 표준편차 ( σ₂) = 2.8
< 1. 가설 설정(목표설정) >
# 귀무가설: H₀: μ₁ - μ₂ = 0
-> 식후 산책을 한 사람들과 그렇지 않은 사람들 사이에 식곤증 평균에 차이가 없다.
(식후 산책 여부가 식곤증에 영향을 미치지 않는다.)
# 대립가설: H₁: μ₁ - μ₂ ≠ 0
-> 식후 산책을 한 사람들과 그렇지 않은 사람들 사이에 식곤증 평균에 차이가 있다.
(식후 산책 여부가 식곤증에 영향을 미친다.)
< 2. 수학식에 넣을 데이터 설정 >
n1 <- 30; n2 <- 30 --- 표본의 갯수
x1_bar <- 4.2; x2_bar <- 6.5 --- 표본의 평균
s1 <- 2.5; s2 <- 2.8 --- 표본의 표준편차
< 3. 통합표준편차 구하기 >
sp <- sqrt(((n1 - 1)*s1^2 + (n2 - 1)*s2^2) / (n1 + n2 - 2))
sp --- 2.654242
< 4. t 통계량 구하기 >
t_stat <- (x1_bar - x2_bar) / (sp * sqrt(1/n1 + 1/n2))
t_stat # -3.356085
< 5. t 임계값 구하기(양측검정) >
df <- n1 + n2 - 2
t_crit <- qt(0.975, df)
t_crit --- 2.001717
< 6. 결과 해석 >
if(abs(t_stat) > t_crit) {
print("귀무가설을 기각합니다.")
print("두 집단간의 평균의 유의미한 차이가 있다고 할 수 있습니다.")
} else {print("귀무가설을 기각할 수 없습니다.")}
< 7. 시각화 >
curve(dnorm, from=-4, to=4, main="t분포와 검정 통계량",
ylab="확률밀도", xlab="t")
abline(v=t_crit, col="red", lty=2)
abline(v=-t_crit, col="red", lty=2)
abline(v=t_stat, col="blue")
legend("topright", legend=c("임계값", "검정통계량"), col=c("red", "blue"),
lty=c(2,1))
결론: 귀무가설이 기각됨에 따라 두 집단간의 평균의 유의미한 차이가 있다고 할 수 있습니다.
따라서 식후 산책 여부가 식곤증에 영향을 미칩니다.