통계라는 것이 간단하게 처리할 분야가 아니지만 최근가입한 우리카페회원들 30명을 무작위추출법으로 표본을 추출하여 기초통계파트인 빈도와 교차분석을 진행해 보았습니다.
혹시나 자신의 정보가 새어나갔다고 의심되는 분 있음 연락주세엽. 전혀 그런문제는 걱정하지 않기를 바랍니다.
1. 왜 30명만 했을까?
보통 통계를 본격적으로 돌리기 전에 기본적으로 샘플링작업을 진행합니다. 약 30케이스가 평균값 등을 기본적으로 산출해낼 수 있어 오차율측정을 가능하게 하기 때문입니다.
표본 및 조사수 등에 따라서 그 기본 샘플링은 달라집니다. 저는 그저 기본적으로 30개만 해보았습니다.
2. 어떤 통계 프로그램을 사용했는가?
저가 개인적으로 구매한 SPSS 7.5 for Window용을 가지고 돌렸습니다. 한글화작업이 진행되고 변수명 및 변수값조정이 용이하며 제가 전문적으로 다루는 프로그램이기 때문입니다. 공과대학계열이나 또는 경제학계열에서는 다른 통계프로그램을 사용합니다. 여러분이 자주사용하는 엑셀이라는 프로그램 역시 공대생들에겐 유용한 통계 프로그램입니다. 경제학 쪽에서는 경제모델산출을 위한 통계프로그램을 다룹니다.
통계학을 전문적으로 하지 않더라도 관심을 가지고 계신분들은 겨울방학 및 여름방학 서울대학교 통계학과에서 교수님들이 진행하는 특강에 관심을 가지면 좋습니다. 물론 기본적으로 통계학 및 조사방법론에 대한 기초적인 지식과 수학적인 지식이 있으면 보다 배우기 용이합니다.
3. 무작위 추출법
랜덤형태의 무작위 추출법을 사용하여 정회원 즉 상절지백가족 중 최근가입한 분들중 30명을 임의로 산출하였습니다.
4. 변수
가. 출생년도별
나. 남여별
다. 지역별
모두 알고 계시지만 개인정보는 위 3가지 밖에 없습니다. 따라서 소속은 신경쓰지 않고 돌렸습니다.
통계량
N
유효 결측
남여별 30 0
지역별 30 0
출생년도별 30 0
통계량은 패키지에서 돌린 조사수를 말합니다.
총 30개 입니다.
남여별
빈도 퍼센트 유효 퍼센트 누적퍼센트
유효 1.00 7 23.3 23.3 23.3
2.00 23 76.7 76.7 100.0
합계 30 100.0 100.0
합계 30 100.0
남여별 빈도율을 살펴보면...음...1번이 남자이니까
약 7명의 빈도에 23.3%정도 차지하고
여성이 23명에 76.7%정도이군요. 우리 카페엔 여성의 비율이 그만큼 높다는 이야기인가요? 추측은 가능하지만 그렇다고 말하긴 이릅니다.
출생년도별
빈도 퍼센트 유효 퍼센트 누적퍼센트
유효 1.00 7 23.3 23.3 23.3
2.00 22 73.3 73.3 96.7
3.00 1 3.3 3.3 100.0
합계 30 100.0 100.0
합계 30 100.0
출생년도에서 1번은 10대, 2번은 20대 3 번은 30대입니다.
20대의 가입이 두드러지는 군요....
다음은 교차분석입니다.
출생년도별로 남여를 구분하여 보았습니다.
출생년도별 * 남여별 교차표
빈도
남 여별 전체
1.00 2.00
출생년도별1.00 1 6 7
2.00 5 17 22
3.00 1 1
전체 7 23 30
교차분석의 결과는 여성 20대가 최근가입한 정회원의 주축으로 추측해 볼 수 있습니다.
지금까지 잼없는 야그 잼나게 읽어주신 여러분 감사합니다. 사실 통계는 이런 기본적인 정보를 바탕으로 회귀분석 등 고급정보를 추려내는 것을 목적으로 합니다. 단순한 빈도분석할려면 한글에 표그리기를 해서 해도 되거나 계산기 두르리면 되죠..
질문지를 잘 작성하여 우리 회원님들의 최근 인터넷 및 카페에 대한 질문을 분석하여 회원전체 즉 표본집단의 값을 추론해 보고싶지만...음냐...먹고사는 것이 지금은 통계가 아니라서 ....헤헤.
사회과학통계를 잘공부하면 재미있게 글을 쓸 수 있습니다. 석사학위를 쓰는 사람들중에 통계학에 문외한 사람들이 의외로 많기 때문에 가을이나 봄에 대학원 게시판에 가보면 통계돌려준다는 광고가 많이 뜹니다. 흠냐...사회과학석사논문쓰면서 통계학과 학부생한테 맡기면 그 통계는 죽을 쓰죠...통계패키지는 잘돌릴지 몰라도 음냐...그 값의 의미를 논문쓰는 사람들에겐 잘 설명을 못하면 음냐 그 값이 똥값이 됩니다.