통계분석기법 용어 정리
자료출처 : 전남대 정봉현 교수님 - 조교
1. 빈도분석 1)개 요 - 각 변수 값에 속한 분포의 특성을 찾아내는 분석기법 - 도수분포표, 집중경향치, 분산도, 히스토그램의 구성 2)기본원리 - 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표 - 집중경향치(central tendency) - 최빈값(mode), 중위수(median), 평균(mean) - 분산도(dispersion) - 범위(range), 변량(variance), 표준편차(standard deviation), 평균의 표준오차(S.E. mean) 3)사용방법 - 통계분석(S)-> 기초통계(U)-> 빈도분석(U)-> 변수선택-> 통계량(S) -> 계속- > - 챠트도표(C)-> 계속-> 형식(F)-> 계속-> 완료 4)해석요점 - 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표 - 집중경향치 - 최빈값, 중위수, 평균 - 분산도 - 범위, 변량, 표준편차, 평균의 표준오차(S.E. mean)
2. 기술통계분석 1)개 요 - 자료의 필요통계량을 간단히 산출하는 분석법. 요약통계량과 Z-점수 계산 2)기본원리 - 기술통계량 - 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오 차, 왜도, 첨도 3)사용방법 - 통계분석(S)-> 기초통계(U)-> 기술통계-> 변수선택-> Z Score 고려-> 옵션(o)- > 계속-> 확인 4)해석요점 - 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오차, 왜도, 첨도
3. 교차분석 1)개 요 - 범주형 변수인 명목/서열자료의 변수간 상관관계인 독립성과 연관성의 분석 2)기본원리 - 상관관계의 가설검증 - 카이제곱 검증, phi계수, Cramer V 및 분할계수 사용 -X2의 값 크면 -변수간 상관관계 높고 관찰과 기대빈도간 차이 큼 3)사용방법 - 통계분석(S)-> 기초통계(U)-> 교차분석(C)-> 변수선택(행,열)-> 통계량(S)-> 계속-> 셀선택(C)-> 계속-> 형식(F)-> 계속-> 확인 4)해석요점 - 귀무가설 선택, 연구가설 기각 : x2계산치 유의도 ≥ α값(0.05) - 변수간 독립적 phi계수, Cramer V, 분할계수 - 0.20 이하(경미한 상관), 0.20-0.40(낮은 상관), 0.40-0.70(상당한 상관), 0.70-0.90(높은 상관), 0.90이상(매우 높은 상관)
4. 신뢰도분석 1)개 요 - 동일개념을 독립 측정방법에 의한 측정결과가 비슷한지의 일관성의 측정 - 설문지의 신뢰성 측정과 요인분석시 추출인자의 신뢰성 측정 2)기본원리 - 반복측정법 - 동일대상의 반복측정시에 유사/동일한 결과가 있도록 하는 측정 - 측정오차분석법 - 측정상에 측정오차의 정도 파악. 측정오차 적음- 자료신뢰도 증 가 - 측정도구검증법 - 신뢰성의 근본 분석 3)사용방법 - 통계분석(S)-> 척화도분석(A)-> 신뢰도분석(R)-> 변수선택-> 모형(M)선택-> 통계분석(S)-> 계속-> 실행 4)해석요점 - 알파값 ; 신뢰도계수Cronbach's x값) > 0.6 - 신뢰도 존재 - 해당변수(A) 제거 문자값 > α값 - A변수 제거시 신뢰도 증대 - F값과 확율(P) ; F값 < 유의도(α=0.01, 0.05) - 귀무가설 기각, 연구가설 채택
5. 상관관계분석 1)개 요 - 분석대상 변수들간의 관련정도, 관계의 방향(정(+)의 방향, 부(-)의 방향), 상관계 수에 대한 가설의 검증 2)기본원리 - Pearson, Spearman의 상관계수(r) ; -1≤r≤1, r=1(완벽상관), r=0(무상관) - 단순상관관계 - 두 변수간 상관관계, 다중상관관계 - 하나의 변수와 둘 또는 두 개 이상 변수간 상관, 편상관관계 - 제3의 변수 통제하에 순수하게 두 변수간의 상관관 계의 표현 3)사용방법 - 단순/다중상관관계 : 통계분석(S)-> 상관분석(C)-> 이변량 상관계수(B)-> 상관 계수,유의성검정 표시-> 옵션(O)-> 계속-> 확인 - 편상관관계 : 통계분석(S)-> 상관분석(C)-> 편상관계수(R)-> 변수선택(V)-> 통 제변수(C)-> 옵션(O)-> 통계량선택-> 계속-> 확인 4)해석요점 - 가설검증 : 귀무가설 상관계수 = 0 - 귀무가설 기각, 변수간 상관관계 존재 - 상관계수 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강한 상관
6. 회귀분석 1)개 요 - 종속변수와 독립변수의 관련성의 강도 파악 - 독립변수 값의 변화에 따른 종속변수 값의 변화를 예측하는 데 사용 2)기본원리 - 선형의 회귀방정식을 도출하여 종속변수를 예측 - 회귀방정식 ; 단순회귀 - Y(종속변수) = a + b1x(독립변수) + e(오차) - 다중회귀식 - Y = a + b1x1 + btxt + e 3)사용방법 - 단순회귀분석 : 통계분석(S)-> 회귀분석(R)-> 선형(L)-> 종속변수(D)-> 독립변 수(I)-> 방법(M)-> 케이스 설명(C)-> 분석 선택사항(S)-> 계속-> 확인 4)해석요점 - 회귀식의 성립여부 판정 : 자유도와 신뢰수준(95%) 계산된 F값> 기준 F값 - 통계 적 의의존재(회귀식 성립). 변량분석 F값 < 유의수준 F값 0.05 - 회귀식 성립 - 상관성 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강 한 상관 - 적합도 : 상관성(multiple)의 제곱값인 적합도(R square) 값 판단 - 통계적 의미변수 : sig t 값 < 0.05 - 독립변수와 종속변수는 통계적 의미존재 - 표준화된 회귀계수(beta)의 절대값이 큰 변수일수록 설명력이 높은 변수
7. T-검정 1)개 요 - 독립된 두 집단간의 평균의 차이가 통계적으로 유의한 지를 검증 2)기본원리 - T값 (제1평균-제2평균/표준오차)과 자유도를 구한후 가설검증 - 신뢰수준 결정(95%), 신뢰수준의 T값의 T분포표에서 구함. 계산된 T값 > 기준 T 값 - 통계적인 유의미한 차이 존재 3)사용방법 - 통계분석(S)-> 평균비교(M)-> 독립표본 T검정(T)-> 검정변수(T)선택-> 집단변 수(G) 선택-> 집단정의(D)-> 계속-> 옵션(O)-> 계속-> 확인 4)해석요점 - 집단의 동질성 여부판단 : F값> P값(95% 신뢰수준) - 집단이 동질적 - T 검정 : T 검정도 값 <0.05 - 95%의 신뢰수준 귀무가설 기각, 연구가설 채택
8. 분산분석 1)개 요 - 두 집단 이상의 평균 차이를 검증하는 데 사용, 일원분산분석과 다원분산분석 2)기본원리 - 종속변수 전체분산 가운데 독립변수와 함께하는 분산이 어느 정도인지를 측정함. - 요인분산 분석(두 변수의 분산효과 분석)과 공분산 분석(외생변수 효과 통제와 나 머지 집단간 평균차이의 검증) 3)사용방법 - 일원분산분석 : 통계분석(S)-> 평균비교(M)-> 일원배치 분산분석(O)-> 종속변수 (D)-> 요인선택(F)-> 대비(C)클릭-> 계속-> 사후분석(post hoc..) - 단일요인 분산분석 : 통계분석(S)-> 일반선형모형(G)-> 단순요인 분산분석(S)- > 종속변수(D)-> 요인선택(F)-> 범위지정(E)-> 계속-> 공변량(C)-> 옵션(O)-> 계속 4)해석요점 - 가설검증 : 귀무가설(u1=u2= --uk) - F값 < 0.05 신뢰수준 95% 귀무가설 기각, 연 구가설 채택 -상호작용(독립변수간 관련성 검증) - F값 > 0.05 95% 신뢰수준 독립변수간 상호작 용 존재
9. 다변량분석 1)개 요 - 종속변수가 2개 이상시 종속변수간 평균값의 차이 검증, 독립변수가 어떤 종속변 수에 더 많은 영향을 미치는 지 파악 2)기본원리 - 독립변수의 종속변수에 대한 공헌도와 종속변수들간의 상관관계를 고려하여 분석 하는 기법 3)사용방법 - 통계분석(S)-> 일반선형모형(G)-> GLM-다변량(M)-> 종속변수(D)-> 모수요인 (F)-> 공변량(C)-> 대비(N)-> 모형선택(F)-> 계속옵션(O)-> 계속-> 확인 4)해석요점 - 메노바 모델 성립에 관한 규정 : Pillai 값 이용 - 통계적 의미 존재 - 분석가능 - 분산의 공분산 동질성검증 : Box M값을 F값과 카에제곱값 환찬 > 유의수준 (P>0.05) - 산포도 행렬 동질성 구비 - 종속변수에 대한 독립변수의 영향력 검증 : sig. F값 < 유의수준 0.05 - 종속변수 는 독립변수에 영향 받음(통계적 의미 존재) - 종속변수간 상관관계 검증
10. 판별분석 1) 개 요 - 독립변수의 역학관계를 바탕으로 종속변수(집단구분)를 추정하는 통계기법 - 집단 판별의선형판별함수 생성과 집단구분에 영향 미치는 변수 발견 2)기본원리 - 정량자료의 독립변수를 이용하여 명목자료의 독립변수집단의 구분시에 오류를 최 소화하는 함수 즉 판별식의 발견 3)사용방법 - 통계분석(S)-> 분류분석(Y)-> 판별분석(D)-> 집단변수(G)-> 범위지정(D)-> 독 립변수(I)-> 통계분석(S)-> 분류(C)-> 변수저장-> 확인 4)해석요점 - Wilks lamda(그룹간 평균차 분석도구) : 평균차가 없음 1, 차이가 큼 0. - 고유값(Elgen value) : 클수록 좋은 판별함수 - cannonical correlation(eta 값) : 높을수록 판별함수 설명력 증대 - tolerance level(독립변수의 선형적 관계표현) : 크면 독립변수의 추가와 설명력 의 미- 신변수 추가 - standardize canonical determinant function coeefient : 평균 0, 표준편차1의 표 준판별함수. 종속변수와 가장밀접한 변수의 파악
11. 요인분석 1)개 요 - 변수들 상호간의 상호의존도를 분석하여 서로 유사한 변수들 끼리 묶어주는 방법 2)기본원리 - 변수를 몇 개의 공통요인으로 묶어 자료요약, 변수구조 파악, 불필요한 변수제거, 측정도구의 타당성 검증, 추가분석에 요인점수 인용, 대상을 묶는 데 유용성 등의 기 능 제공 3)사용방법 - 통계분석(S)-> 데이터 축소(D)-> 요인분석(F)-> 변수선택(V)-> 기술통계(D)-> 요인추출(E)-> 요인회전(T)-> 요인점수(S)-> 옵션(O)-> 계속-> 확인 4)해석요점 - 상관행렬 파악, 공통성(communality)의 추출, 변수들의 공분산 및 고유치 - 고유치 스크리 도표, 회전전의 성분행렬, 회전된 성분행렬, 성분변환행렬, 회전공 간의 성분도표 검토, 성분점수 계수행렬
12. 군집분석 1)개 요 - 대상 속성들의 유사한 성향을 바탕으로 동질적인 집단으로 묶어 동일집단내에 속 하는 공통특성을 찾음. 2)기본원리 - 변수들의 유사성 평가시 오류를 피하기 위한 변수선정이 중요한 문제 - 군집화의 공통원칙은 군집내 대상들간 유사성의 극대화, 군집간 유사성은 극소화 계층적 군집화 방법이 보편적이며, 3)사용방법 - 통계분석(S)-> 분류분석(Y)-> 계층적 군집분석(H)-> 변수선택(V)-> 통계량(T)- > 도표(O)-> 방법(M)-> 계속-> 저장-> 확인 4)해석요점 - 상관계수(coefficient)가 클수록 대상 속성들이 들어 있는 군집간의 이질성이 큼.
|