정규분포 <normal distribution>(正規分布)
도수분포곡선이 평균을 중앙으로 하여 좌우대칭인 종 모양을 이루는 것을 말한다.

- 신장(身長)의 분포, 지능(知能)의 분포 등 그 예는 많다. K.F.가우스가 측정오차의 분포에서 그 중요성을 강조하였기 때문에 이것을 가우스분포·오차분포라고도 하며, 그 곡선을 가우스곡선 또는 오차곡선이라 한다. 또한 A.J.케틀레가 통계에 이용하였으므로 이것을 케틀레곡선이라고도 한다.
- 이 곡선의 함수는

로 된다. 여기서 m은 평균값, σ는 표준편차이므로, 정규분포는 평균값 m과 분산 σ2으로써 결정된다. 변수 x를 t=(x-m)/σ 에 의하여 t로 변환하여

를 만들면 φ(t)=σf(x)로 된다. φ(t)는 m=0, σ=1인 정규분포이므로, 이 분포의 수치표를 만들면 그것에 의해서 여러 가지 m과 σ에 대한 f(x)의 수치를 구할 수가 있다.
- 곡선은 x=m에서 최대이고 m에서 멀어짐에 따라 하강하여 x=m±σ인 데에서 변곡(變曲)한다. 즉, 아래쪽으로의 오목이 위쪽으로 오목으로 변하게 된다. 또한 m에서 한없이 멀어짐에 따라 x축으로 한없이 접근한다. 분포곡선과 x축으로 둘러싸는 넓이가 전도수(全度數)를 나타낸다.
- f(x)나 φ(t)에서는 x나 t를 확률변수로 하고 있으므로, 넓이는 1로 된다. 그 넓이는 x±m의 범위 내에서는 68.3 %, m±2σ의 범위 내에서는 95.5 %, m±3σ의 범위 내에서는 99.7 %로 된다.
- 한편 2개의 확률변수 x1, x2가 독립이고, 각각 m1,σ12 및 m2,σ22의 평균값과 분산을 가지는 정규분포일 때, 변수 x1+x2는 평균값 m1+m2, 분산 σ12+σ22의 정규분포로 된다.
- 이 사실로부터 중심극한정리(中心極限定理)의 특별한 경우인 ‘n개의 표본을 몇 개의 조(組)로 생각할 때, 그 평균값의 분포는 n을 크게 함으로써 자연히 평균값 m, 분산 σ2/n인 정규분포에 한없이 접근한다. m과 σ2은 각각 모집단의 평균값과 분산으로 된다’라는 사실이 성립한다. 수리통계에서 이 정리는 매우 중요하다.
| | |