아래에 통계분석 질문을 남겨주세요.
=>안녕하세요. 요인분석과 상관분석에 대한 질문이 생겨 문의드립니다.
9개의 문항으로 이루어진 설문조사를 바탕으로 (주성분분석/베리맥스회전) 요인분석을 수행하였더니 2개의 요인으로 분류되는 것을 확인하였습니다.
각 요인에 할당된 각 문항의 값을 평균하여 두 개의 독립변수 값을 설정하였습니다.
이후 회귀분석을 수행하고자 하였는데, 상관분석 결과 요인분석의 결과로 도출된 두 개의 변수 간 상관관계가 0.7 이상으로 매우 높게 나타났습니다. 이에 다중공선성 문제로 인해 회귀분석을 수행하지 못하는 상황입니다.
해당 문제에 대해 확인한 결과 다음의 방법들에 대해 고려중인데요, 어떠한 방법이 맞는지 잘 몰라서 문의드립니다.
1. 문항 응답 값을 평균하지 않고, SPSS '변수로 저장' 기능을 활용하여 요인점수를 변수로 설정
-> 이 경우 베리맥스 회전은 요인점수 간 상관관계가 존재하지 않음을 가정하기 때문에 상관관계가 0으로 매우 유의하게 나타나게 됩니다. 상관관계가 0이므로 회귀분석을 수행할 때 두 변수를 모두 활용하는 것에 상관이 없는지요?
2. 베리맥스 회전이 아닌, (공통요인분석/직접 오블리민) 요인분석을 수행 (그 외 값은 모두 디폴트 값을 활용)
-> 이 경우 두 개의 요인으로 추출되나, 구조행렬이 아래와 같이 한 쪽의 요인은 모두 음수의 값만을 갖습니다. 왜 두 개의 요인이 추출되지만 이렇게 한쪽의 요인은 모두 음수가 나타나는지 모르겠네요. 수렴을 위한 반복 횟수를 100으로 늘려보아도 같은 결과가 나타납니다. 각 문항이 요인으로 어떻게 묶이는지 어떻게 알 수 있는지요..?
첫댓글 안녕하세요. 내용을 보니 독립변수 1개로 파악됩니다. 다중공선성은 독립변수가 여러개일때 고려해야 합니다.
덧붙여 요인분석 값을 변수로 사용하고자 하면 독립변수와 종속변수간에 상관성이 없는 것으로 나올겁니다. 이 역시 독립변수가 여러개일때 다중공선성이 발생할 경우 독립변수들을 요인분석 값으로 변경하여(참고로 이때는 각 요인변수들의 변수명을 지정하기가 곤란한 경우가 있습니다.) 독립변수들끼리의 상관성을 없앤 후 회귀분석을 진행하는 것인데 선생님의 경우는 단순회귀분석으로 보여 그냥 진행해도 무리가 없어보입니다.