대학생분들 중간고사 끝나셨을텐데 점수 공지해주실 때 교수님께서 보통 평균이랑 표준편차만 공지해주시는 경우가 많은데요. 저렇게 공지해주셨는데도 따로 석차 문의하시는 경우가 있더라구요. 모르시는 분들이 많은거 같아서 간단하게 엑셀로 자신의 등수 알아보는 법 알려드립니다.
요즘에는 중고등 학교에서 등수를 공개하지 않고 평균과 표준편차만 공개합니다. 이는 등수를 매기는 것에 의한 폐해를 방지하기 위한 것입니다. 즉, 등수에 대한 짐작만 하라는 의도인데, 점수가 이루는 분포가 알려져 있지 않으므로 정확한 등수를 계산할 수는 없습니다.
분포를 알면 확률을 계산할 수 있는 데, 만일 점수(score)가 Normal분포를 한다고 가정하면 점수를 표준화(standardize)한 다음 standard Normal분포, 즉 평균, 분산이 각각 0, 1인 표준정규분포 확률표에서 누적확률을 찾은 다음 1에서 빼면 상위 몇 %인지를 의미합니다. 따라서, 전체숫자를 곱하면 등수가 됩니다. 표준화(standardization)는 점수를 평균을 뺀다음 표준편차로 나누는 것입니다.
그런데, 이는 번거로우므로 Ms-Excel을 사용하면 편리합니다. Ms-Excel에서는 =normdist function을 사용하는데 다음과 같이 확률을 계산할 수 있습니다.
=1-normdist(x,평균, 표준편차,1)
=normdist function은 NORMal DISTribution이라는 의미인데 Normal분포에서의 확률을 구하는 function입니다. 여기서 1은 CDF를 의미하는 데 Normal분포에서 -무한대 부터 x까지의 면적, 즉 확률입니다. 따라서, 상위 몇 %인지를 파악하기 위해서는 1, 즉 100%에서 빼면 됩니다.
예를들어 국어점수의 평균, 표준편차가 각각 70, 20이며, 관심의 대상이 되는 점수, 즉 x가 80점이면 상위 몇 %인지는 다음과 같이 구합니다.
=1-normdist(80,70,20,1) = 약 31%
따라서, 80점은 평균, 표준편차가 70, 20인 Normal분포에서 상위 약 31%에 위치하는 point입니다. 80점보다 낮은 점수는 전체에서 1-31% = 69%를 차지합니다.
따라서, 전체 학생수가 200명이면 200*31% = 약 62등과 같이 계산할 수 있습니다.
만일, 20등이 되기 위해 몇 점을 맞아야 하는 지를 계산하기 위해서는 Normal분포의 inverse(역행렬)를 구하는 =norminv function을 사용해 다음과 같이 구할 수 있습니다. 참고로, 여기서는 전체가 200명이므로 20등이라는 것은 상위 10%입니다.
=norminv(90%, 70,20) = 약 95.6점