1. 지난번에 똑같은 연구주제를 가지고 두가지 유형으로 구조방정식을 할 수 있다고 했습니다. 조금 복잡한 모형과 간단한 모형으로요. 앞에서는 큰 모형, 작은 모형이라는 이후부터는 복잡모형, 간단모형이라 이름 붙이겠습니다. 학술적 용어는 아닙니다. 저널에 내는 논문은 통상 간단한 모형이고 저는 통계분석 하나 마나 뻔한 결과가 나오기 때문에 거의 의미가 없는 일이라고 비판을 했습니다.
하여간 구체적인 예로 복잡한 모형과 간단한 모형의 구조방정식 모형을 소개합니다. 여러분이 구조방정식을 써서 학위논문을 쓸 때 과에서 복잡한 모형을 요구하는지 아니면 간단한 모형을 요구하는지 미리 알아보고 의뢰를 부탁해야 합니다. 그렇지 않으면 나중히 완전히 다시 분석을 해야 불행한 사태가 벌어질 수 있습니다.
우리가 보고 싶은 것은 직무 스트레스가 조직 성과에 영향을 미치는지 여부입니다. 그래서 연구변수로 직무 스트레스에서는 하위영역변수로 경제적 스트레스와 인간적 스트레스를 잡고 조직 성과로 직무만족과 조직몰입 두 개를 하위영역변수로 잡았습니다. 그럼 가설을 다음과 같이 잡을 수 있습니다.
간단 가설: 가설 H1: 직무스트레스는 조직성과에 영향을 미친다.
복잡 가설:
가설 H1: 직무스트레스는 직무만족에 영향을 미친다. 가설 H1.1: 경제적 스트레스는 직무만족에 영향을 미친다. 가설 H1.2: 인간적 스트레스는 직무만족에 영향을 미친다.
가설 H2: 직무스트레스는 조직몰입에 영향을 미친다. 가설 H2.1: 경제적 스트레스는 조직몰입에 영향을 미친다. 가설 H2.2: 인간적 스트레스는 조직몰입에 영향을 미친다.
위 가설을 검증하는데 구조방정식 모형을 쓰지 않으면 그냥 회귀분석이 됩니다. 처음의 간단 가설은 독립변수가 하나가 들어가는 단순회귀분석, 즉 상관계수 구하는 것이랑 같다고 했지요. 그리고 복잡가설은 독립변수가 2개 들어가는 회귀분석을 두 번하면 됩니다.
위 가설 검증을 구조방정식으로 하면 어떻게 될까요. AMOS에서 다음과 같은 그림을 그리고 돌리면 됩니다.
간단 모형
복잡모형
간단모형과 복잡모형간의 구별이 좀 되시는지요.
위 그림에서 동그한 부분은 관찰되지 않는 변수입니다. 네모는 관찰된 변수이고요. 여기서 주의해서 봐야 할 부분이 단순 모형에서는 경제적 스트레스나 인간적 스트레스, 또 조직성과에서 직무만족과 조직몰입 모두 관찰된 변수입니다. 한편 복잡모형에서는 실제 설문문항이 관찰된 변수이고 경제적, 인간적 스트레스, 직무만족, 조직몰입은 모두 관찰되지 않는 잠재변수입니다. 이게 뭘 이야기하는 걸까요.
실제 설문지 부분과 데이터 부분, 그리고 그림과 연결하여 설명해 보겠습니다. 예에서 각 구성개념, 즉 연구변수를 측정하는 설문문항은 2개로 했습니다. 설문문항은 Likert 5점 척도로 했습니다. 그리고 매우 그렇다를 제일 왼쪽, 그렇다를 제일 오른쪽에 써야 합니다. 그렇지 않으면 코딩시 거꾸로 하거나 아니면 제대로 코딩한 후 통계프로그램에서 다시 역코딩을 해야 합니다.
설문지부분
이렇게 설문지를 작성한 다음 100명에게서 응답을 받았다고 하죠. 그럼 엑셀에다 코딩하면 이렇게 됩니다.
처음 경제1부터 조직2까지 데이터는 설문지에 사람들이 응답한 번호를 그대로 적으시면 됩니다. 따라서 설문문항에 해당하는 변수는 관찰된 변수이죠. 복잡모형의 경우 경제1부터 조직2까지 설문문항에 있는 값들을 타이핑해서 적으시면 됩니다.(먼저 엑셀로 작업하는 것이 편합니다. 엑셀로 데이터를 만든 후 SPSS에서 불러 오면 자동적으로 SPSS 데이터가 됩니다. SPSS 교재에는 여러 종류의 결측값이 나오는데 이런 것 신경쓰지 말고요 응답하지 않은 경우는 엑셀에서 코딩할 때 그냥 빈칸으로 두면 됩니다)
그런 다음 위 복잡모형 그림을 그리고 위의 경제1부터 조직2까지의 데이터 변수와 복잡모형 그림과 연결시켜 주면 됩니다. 어떻게 연결시키냐는 AMOS 구조방정식 책에 보면 다 적혀져 있습니다.
그러나 간단 모형에서는 경제적 스트레스, 인간적 스테레스, 직무만족, 조직몰입이 관찰된 변수입니다. 이 변수들의 값은 설문지에 나오지 않는 값입니다. 그래서 데이터 앞 부분에 있는 경제1부터 조직2까지 설문문항의 값을 가지고 통계프로그램에서 본인이 직접 구해야 합니다. 즉 경제1과 경제2를 평균해 경제 스트레스라고 새 변수를 만들고, 인간1과 인간2를 평균해 인간적 스트레스라는 새 변수를 만들고 이런 작업을 하셔야 합니다.
그런 다음 새로 만들어진 데이터 상의 경제스트레스, 인간스트레스, 직무만족, 조직몰입 변수와 간단모형 그림 상의 경제스트레스, 인간스트레스, 직무만족, 조직몰입과 연결해서 AMOS에서 돌리면 됩니다.
다음은 우리나라 실제 박사 논문의 예입니다. 여기서는 간단모형과 복잡모형을 짬뽕해서 돌렸습니다. 이렇게 하면 안됩니다. 방법론의 일관성은 최소한 유지해야 합니다.
아래 충성도 부분에 동그라미 친 부분은 복잡모형으로 했습니다. 즉, 권유, 재방문, 추천. 재이용은 실제 설문문항의 변수입니다. 그러나 나머지 부분의 관찰변수(네모부분)은 설문문항 변수가 아닙니다. spss에서 설문문항을 평균해 구한 변수들입니다. 즉 간단모형으로 한 것입니다.
2. 구조방정식에서 조절효과
구조방정식은 본질적으로 매개변수가 들어 있는 모형을 분석하는 모형입니다. 그러나 간혹 조절효과도 보라고 요구하는 경우가 있습니다. 제가 가지고 있는 AMOS 버전이 옛날 버전이라 확실히 장담하지 못하겠지만 아직까지는 조절변수가 이진형 변수인 경우, 예를 들어 남자, 여자 두 경우만 있는 성별 같은 변수를 조절변수로 설정해서 보는 방법밖에 없는 걸로 압니다.
해석은 조절효과 보는 것이랑 같습니다. 단지 조절변수의 효과는 알 수 없습니다. 위의 예의 간단모형의 경우를 예로 들어 보죠. 먼저 연구 모형 그림을 보죠.
앞에서 조절효과 이야기를 했지만 스트레스가 조직성과에 미치는 영향이 성별, 즉 남자. 여자의 경우 유의적인 차이, 뚜렷한 차이가 있는지 보는 것입니다. 그래서 남자집단의 경우 위 화살표의 회귀계수 b(남자)를 구하고, 여자집단의 경우 화살표의 회귀계수 b(여자)를 구하고 그래서 두 개의 회귀계수가 유의적인 차이가 있는지 없는지 보는 것입니다. 그래서 성별의 조절효과를 가설로 정확하게 표현하면
H0(귀무가설): b(남자)-b(여자)=0
H1(대립가설): b(남자)-b(여자)는 0이 아니다.
이렇게 됩니다.
이게 구조방정식에서 조절효과가 들어가는 경우입니다. 이게 끝입니다. 사살 구조방정식이 별거 아닌데 괜히 폼나는 것 같아 구조방정식을 논문을 쓰는데 실제 분석 결과는 별게 없거든요. 그러니까 사람들이 더 할 게 없으니까 이런 것들을 한다는 것이죠.
이걸 Baron & Kenny의 조절효과 모형으로 회귀분석을 돌리면 아래 식처럼 됩니다.
조직성과=b0+b1*스트레스+b2*성별+b3*(스트레스*성별)
이렇게 되죠.
그럼 다음과 같은 질문이 생길 수 있을 겁니다.
1) 왜 성별과 같은 이진형 변수만 조절변수로 넣을 수 있나요? 2) 저는 성별과 같은 변인 말고 소득, 체중, 이런 연속형 변수를 구조방정식에 조절변수로 넣고 싶은데 이건 불가능한가요?
이런 문제가 제기될 수 있다는 것입니다.
1)번 문제
성별 외에도 학력 같은, 즉 고졸 이하, 전문대 졸, 대졸 이상 이렇게 범주가 세 개 있다고 하죠. 이론적으로 하는 것은 문제가 없습니다. 그러나 비교를 하려면 이젠 세 개의 경우를 비교해야 합니다. 고졸이하 집단과 전문대졸 집단, 전문대졸 집단과 대졸 이상 집단, 고졸이하 집단과 대졸 이상 집단 이렇게 세 가지 경우를 비교해야 한다는 것이죠. 그런 학력은 고졸 이하, 전문대 졸, 대졸, 대졸 이상 이렇게 4개의 범주로 했다고 하죠. 그럼 이제 조절효과를 보기 위해 비교해야 하는 경우가 6개로 확 늘어납니다. 그래서 1)번 문제를 AMOS에서 구현하려면 결과물이 기하급수적으로 늘어납니다.
2)번 문제
2번 문제의 해결은 간단합니다. 연속형 변수를 평균을 중심으로 평균 이하인 집단을 0, 평균 이상인 집단을 1로 코딩하여 새로이 이진형 변수를 만들어 이 변수를 조절변수로 사용하면 됩니다.
그럼 이런 문제가 또 제기될 수 있습니다. 나는 이런 범주형 변수가 아닌 연속형 변수 자체를 조절변수로 사용하고 싶다는 것이죠. 이론적으로 됩니다. 단지 사람들이 하지 않는다는 것이죠.
예를 들어 스트레스가 조직성과에 영향을 미치는데 근무경력에 따라 그 영향력이 어떻게 달라지는지 보고 싶다는 것이죠. 근무경력을 년 단위로 코딩했습니다. 그럼 근무경력은 사실상 연속형 변수로 봐야 합니다. 이 경우 Baron & Kenny의 조절효과 회귀분석 모형으로 쓰면 다음과 됩니다.
조직성과=b0+b1*스트레스+b2*근무경력+b3*(스트레스*근무경력)
그럼 위 식을 AMOS에서 구현시키면 됩니다. 즉, 아래 그림처럼 AMOS에서 그려서 돌리면 됩니다. 단 돌리기 전에 스트레스*근무경력 이라는 상호작용항을 SPSS에서 이미 데이터에 미리 만들어 놓아야죠.
다음은 구조방정식에서 실제로 경로계수, 회귀계수 값을 어떻게 구하는지 간단히 이야기 하고요, 다음에 적합도에 관해서 간단히 이야기 하겠습니다. 적합도는 통계학 전반적으로 나오는 개념인데 사실 사회과학 교수들이 이 개념이 전혀 잡혀져 있지 않습니다. 즉 가장 적절한 모형, 모형 선택 이런 개념들이 전혀 되어 있지 않다는 것이죠. 그런데도 구조방정식에서는 유별나게 적합도를 따지고 있죠. 가끔 보면 웃기지도 않습니다. 그래서 적합도에 관해서 이야기를 하려면 꽤 많은 시간과 양을 차지해야 할 것 같은데 간략하게 소개하는 것으로 그치겠습니다. |
출처: 학위논문통계 원문보기 글쓴이: 학위논문통계