다른분들 SPSS 이런걸로 올리셨던데 저는 아직 할줄아는게 엑셀밖에 없어 엑셀을 활용해봤습니다.
아래에 통계분석 질문을 남겨주세요.
=>

* 기본정보
X축 : 년도수 - (13은 사용한지 13년되는 해에 불량품이된 제품수 입니다.)
(15는 사용한지 15년되는 해에 불량품이된 제품수 입니다.)
Y축 : 불량품갯수를 의미합니다.
회사에서... 위와같은 그래프를 주시면서...
가장 합리적인 평균값, 신뢰도가 높은값을 정하라는 과제를 내주셨습니다. ㅠㅠ
저는 아래와 같은 방법 - 엑셀을 사용하여 풀었습니다.


본 제품이 몇년도에(몇년이 지난후에) 고장나는지를 알아보라는 알아보라고하셔서
몇년을 이 제품의 평균 고장년도인지를 파악하기위하여.
1.평균을 구하기 위하여 각각의 년도 * 불량대수/총불량대수를 합한값을 냈습니다.
2. 각각의 x^2P(x) - {xP(x)}^2 를 합하여 분산을 구한뒤 양의제곱근으로 표준편차를 구했습니다.
3. confidence 함수를 써서 Confidence(0.05 , 표준편차, 총불량대수(총도수))를 통하여 신뢰도를 구하고
평균 +- 신뢰도를 통하여 신뢰구간을 정하였습니다.
본 그래프가 정규분포를 따른다는가정하에 95%신뢰도수준 구해서
평균값 표준편차를 계산하였습니다.
그리고 본 자료를 제출을 하자 이런 의미가 아니라.
그래프의 생긴 것에따라 어떤 그래프는 좌측에 치우쳐 있고 어떤그래프는 오른쪽에 치우쳐있고 어떤그래프는 이쪽저쪽 중구남방 퍼져있는데 그것들을 감안해서 가장 합리적인 평균을 구하고 그 논리를 만들어오라고 하셨습니다.
도대체 어떻게 해야하는지 감이 안옵니다.
대학교때 통계학 개론책배울때 생각해서 신뢰도 구하고 평균을 구한것까지는 할수있곘는데
도대체 가장 합리적인? 그래프 생긴것을 보고 치우친 정도를 감안하고 가장 논리적이고 합리적인 평균을 구하라는 말
이 잘 와닿지 않습니다. ㅠ
이미 평균을 구한것 자체가 모든걸 감안해서 나오는것 아닌가요?
치우친 정도... 그런것들 다요 .. ㅠ
어떻게 해야할까요?
그래프를 봤을때 어디를 평균, 대표값으로정해야 할까요
제 궁금증은
질문 1. 일단 제가 제대로 풀었는지 궁금합니다.
질문 2. 그래프 그리기가 너무 어렵습니다. spss라던가 sas 이런 통계프로그램에서는 위와같은 자료의 평균을 어떻게 구할수 있을까요? 통계프로그램에서 위와같은 그래프가 잘 안그려지던데... ㅠㅠ
년도수 1234... 와 불량품수... 를 종합해서 평균 불량품 발생 년도수를 구하다 보니 저는 위와같이 복잡하게 풀었는데
통계프로그램의 통계값 계산하는 부분에서 보다 위와 같은자료 상대도수로 곱해야하는 자료의 평균값을 구할수 있는 방법이 있을까요? 통계초보라 질문이 엉성한점 이해 부탁드리겠습니다 ㅠ
질문 3. 그래프의 생긴 것에 따라 평균을 다르게 해야한다는 의미가 통계학적으로 어떤의미인지 알고싶습니다.
질문 4 . 제가 곰곰히 생각해 보니 본 그래프는 정규분포를 따른다는 가정이 잘못된것같은데...
그럼 신뢰도를 구할수 없는겁니까?
책을 뒤적여 보니 비모수통계분석이라는게 있는데 그것을 통해야 하는게 아닌지 궁금합니다.
제가 주변지인이나 인터넷에도 이 내용을 질문했는데 포아송분포로 풀라는 말이 있는데.
시간이 지남에 따라 평균 불량률을 구하는 것이 아니라 평균적으로 불량품이 발생하는 "시간(년도)"를 찾는건데 어떤식으로 적용이 되는건지 이해가 잘 안갑니다.
어떤 방향으로 접근해야 할지... 업무에 적용할수있게 예를들어 설명해주시면 정말 감사드리겠습니다. ㅠㅠ 부탁드리겠습니다.
이와 유사한 그래프가 수십가지있는데 ... 방법을 좀 알려주시면 감사하겠습니다. 오늘하루종일 고민해봐도 잘 모르겠습니다 이것만 이해하면 다른것들 금방 할수 있을것 같습니다. ㅠ 도와주십시오
통계학술연구회 SPSS온라인 교육 : http://www.stats.or.kr/?content=spss