표준편차를 설명하기 전에 우선 평균과 편차, 분산을 설명해야 합니다. 예를 들어 1~10까지 숫자가 쓰여있는 카드를 열번 뽑았을 때 우연히도 1~10을 순서대로 모두 한번씩 뽑았다고 가정합니다.
그러면 아래와 같은 표를 만들 수 있습니다.
편차라는 것은 각각의 데이터에서 평균을 뺀 값입니다. 각각의 편차 값들은 데이터가 평균에서 얼마나 떨어져있는지를 나타내어 주지만 편차 값들은 양수와 음수 두가지 형태를 띄기 때문에 모두 더했을 때는 0이 됩니다.
따라서 이 값(0)으로는 평균에서 데이터들이 얼마나 떨어져있는지, 형태를 가늠 할 수가 없기 때문에 각각 편차를 제곱해서 음수를 양수로 바꿔주는 방법을 사용하는 것 입니다. 그렇게 얻을 수 있는 값이 82.5이고, 편차의 제곱 합만 구한다면 데이터 갯수(n)이 커질 수록 무한정 값이 커지기 때문에 이 값을 n으로 나눠 줍니다. 이렇게 얻는 값이 분산입니다. (편차의 제곱합/n) 그리고 분산의 제곱근 값이 표준편차 입니다. (분산=표준편차^2)
분산에 비해 표준 편차가 특별한 의미를 갖는다기 보다는 분산 값이 너무 크기 때문에 작은 수로 표현하려는 일반적인 형태로 이해하시면 좋을 것 같습니다.
결론적으로 분산(표준편차)는 데이터들이 평균을 중심으로 얼마나 퍼져있는지를 의미하지만 그 값만 가지고는 형태까지는 추정할 수 없다 라고 이해하시면 됩니다. 물론 이 집단은 정규분포를 가정한다고하면 그래프의 형태가 결정된 것 이기 때문에 표준 편차를 가지고 얼마나 퍼진 형태(납작한 형태)의 그래프인지 확인 할 수 있습니다.
(같은 표준 편차를 갖더라도 그래프의 모양은 얼마든지 달라질 수 있으니까요. 대충 이정도 이겠구나 하는 감을 잡는 정도로 받아들이시면 됩니다. 추정과 검정에서는 중요한 요소로 활용되지만 데이터 분포에 대해서는 이정도 ^^)
표준편차(standard deviation, 標準偏差)는자료의 산포도를 나타내는 수치로, 분산의 음이 아닌 제곱근으로 정의된다. 표준 편차가 작을수록 평균값에서 변량들의 거리가 가깝다. 통계학과 확률에서 주로 확률의 분포, 확률변수 혹은 측정된 인구나 중복집합을 나타낸다. 일반적으로 모집단의 표준편차는 (시그마)로, 표본의 표준편차는 (에스)로 나타낸다.