Y = 1인당 도로부문 이산화탄소 배출량
X1 = 인구밀도 (1인당 시가지 면적(m2) )
X2 = 통근자중 미혼의 비율
X3 = 대중교통 통근자 비율
X4 = 1인당 자동차 대수
X5 = 도시공간상 인구분포의 확산정도(값이 높을수록 인구가 분산되어 있음)
X6 = 1키로미터당 도로길이
X7 = 종사자 밀도의 지니계수(편중된 정도를 나타냄. 1에 가까우면 편중, 0에 가까우면 균등)
조정된 R2=0.78 입니다.
기본적인 회귀모형 설명이 가능합니다만 제가 하고 싶은 것은 인구밀도(X1)가 X2~X7를 통제 제어하였을 때 Y= constant + b1X1 라는 공식을 만들고 싶습니다.
X2~X7 이 제어 또는 조정된 상태에서 단순회귀모델을 만들어서 인구밀도(X1) 값의 변화에 따라, 다른 독립변수가 통제되었을 때 종속변수(이산화탄소:Y)의 예측을 산포도와 상관계수, 회귀방정식을 보여주고, 인구밀도(X1)의 변화에 따른 다른 변수가 통제된 이산화탄소 배출량(Y)의 변화를 설명하고 싶습니다.
이렇게 특정 독립변수가 다른 독립변수를 제어 조정 하고 난 후에 종속변수에 영향을 미치는지를 방정식으로 표현하는 방법은 어떻게 하는지 알려주시면 대단히 고맙겠습니다.
이와 같은 분석을 하려는 이유는 다음 분석에서 경로분석을 하려고 하는데 적합한 이론을 구축해야 하기 때문에, 다른 독립변수가 제어 되었을 때, 특히, 인구밀도(1인당 시가지면적)가 어떻게 이산화탄소 배출량에 영향을 미치는지를 방정식을 만들어서 수를 대입하여 계산해보고 싶어서 그러는 것입니다.
Hierarchical (or sequential) multiple regression 으로 이런 분석이 가능하다고 참고서적을 보니, 다른 독립변수가 제어 되었을때의 R2 change 로 variance (variation)의 양만 설명이 되어 있더군요.
제가 생각한 방법은 아래와 같은데 이런 방법도 사용이 가능할까요?
(1) Stepwise Method로 얻은 회귀모델에 X1(인구밀도)을 70개 도시의 평균값으로 넣고 통제하고 싶은 독립변수X2~X7 는 실측 값을 넣어 Y(이산화탄소)의 계산합니다. 인구밀도의 평균을 사용하면 인구밀도가 변화가 없는 상태에서 70개 도시의 다른 독립변수의 영향에 의한 종속변수(이산화탄소) 값이라고 생각했습니다.
(2) 예측된Y 값과 실측된 X1값(인구밀도)과 상관관계 및 단순회귀를 해본다.
위와 같이 하는 게 의미가 있는 건지도 모르겠고, 혼자서 괜히 이상한 방법 만드는거 같아서, 이런 경우에 적합한 방법이 있다면 알려주시면 좋겠습니다.
처음 시도한 방법은 위의 중회귀모델을 통해 나온 Unstandardized Predicted Value에 대하여 X1 과 X2 를 대입하여 단순회귀모델로 설명을 해보려고 한 시도입니다. 하지만, 역시 중회귀모델에 나온 값을 다시 단순회귀를 하니, 실제 Y (이산화탄소 배출량) 과의 상관성보다 Predicted Y 의 값이 더 높게 나오고 이건 독립변수를 제어 조정한 후에 특정 독립변수가 종속변수에 어떻게 영향을 미치는지의 방법이 아닌거 같아서 문의를 드려봅니다.
첫댓글 이미 모형을 만들었잖아요. 다른 변수는 고정되었을때 X1의 영향이 기울기값(0.003)이죠. 다른 작업을 할 필요가 없을 것 같은데... 회귀분석 책을 다시 살펴보세요.