기술통계치의 해석을 위해서 먼저 기술통계치에는 어떤 것들이 있는지 알아보자. 대표적인 기술통계치에는 먼저 변수들의 집중경향(central tendency)을 나타내는 값들로 평균(mean), 중앙치(median), 최빈치(mode)가 있으며, 산포의 정도를 알기 위한 값으로 최소값, 최대값, 표준편차 등이 있다.
평균(Mean)
평균값이란 정확하게 이야기하면 산술평균을 의미하는 것으로서 변수가 어떻게 집중화되어 있는가를 나타내는 값이다. 따라서 변수값에서 대표되는 수치를 찾아내어 집단의 성격을 파악하는 분석기법이 바로 평균값 분석이다. 이 방법은 수치로 집단의 성격을 간단 명료하게 설명할 수 있다는 장점을 가지고 있으며, 계산 방식도 단순하여 집단의 구성원이 갖고 있는 변수의 값을 모두 합한 다음 이것을 전체 구성원의 수로 나누면 된다.
중앙치(Median)
중앙치는 평균치와 마찬가지로 집단의 성격을 대표하는 통계분석기법의 하나로서 가운데에 있는 수를 뜻한다고 볼 수 있다. 예를 들어 한 반에 1등부터 50등까지 있을 때 25등이 그 반의 중앙치가 되는 것이다. 그러나 중위수를 계산하는 방법은 전체의 빈도수가 둘이기 때문에 두 값의 평균값이 중앙치이고, 홀수일 때는 전체의 빈도수에 1을 더하여 나누면 그 값이 중앙치가 된다.
최빈치(Mode)
최빈치는 특정 질문의 항목에 가장 많이 나온 값을 말한다. 예를 들어 한 학급의 성적 내본 결과 60점을 받은 사람이 가장 많다면 60이 최빈치가 된다. 특정 질문 항목에 변수값이 몰려 있다는 것은 사람들의 관심이 가장 높다는 것을 의미한다. 일반적으로 조사에서 최빈치가 여러 개인 경우가 있다. 이런 경우에는 통계분석 기법으로 별 의미가 없다.
그러나 이러한 값들도 어떤 자료에서나 사용할 수 있는 것이 아니라 자료의 종류(척도의 성격)에 따라 사용되는 값들이 달라진다. 아래 그림은 척도에 따라 어떤 값을 사용하는 것이 바람직한가를 나타내고 있다.
명목척도(nominal scale) → 최빈치(mode)
서열척도(ordinal scale) → 평균치(mean)
등간척도(interval scale) → 중앙치(median)
비율척도(ratio scale) → 평균치(mean)
이 밖에도 많이 사용되는 값으로는 최소값(minimum), 최대값(maximum), 변동범위(range)가 있으며, 최소값과 최대값은 특정 질문에 해당하는 변수의 값이 가장 적은 빈도수와 가장 큰 빈도수를 말하며, 가장 큰 빈도수와 가장 적은 빈도수 간의 차이를 변동범위라고 한다.
또 하나의 중요한 값으로는 표준편차를 들 수 있다. 표준편차(Standard Deviation: 간단히 SD.라고 쓰기도 한다)는 평균값에서 어느 정도 떨어져 있는지를 알 수 있는 산포도 측정 도구이다. 표준편차를 구하는 공식은 '제곱편차의 루트값'이다. 표준편차가 작을수록 평균값 주변에 몰려 있고 클수록 평균값에서 떨어져 있다. 또한 변수값의 단위가 커지면 표준편차도 커집니다.