[다중회귀분석] 독립변수 통제후 특정독립변수의 영향력은?

안녕하세요. 어제 저녁부터 다중회귀분석을 하고 있는데, 꽉 막혀 버렸습니다. 아래부터 질문 내용입니다. 제가 하는 분석의 대상은 70개 한국의 시급도시입니다. 모든 변수는 인구주택센스서 원시데이타, 시군통계연보, 각종 통계연보 및 GIS 를 통하여 구하였고, 모두 Numeric 변수입니다. 상관관계분석, 변수의 변량, scatter graph 판독을 통하여 독립변수를 28개를 최종 선택하였습니다. 종속변수는 도로교통 이산화탄소 배출량입니다. 통계프로그램은 SPSS를 사용하고 있습니다. Stepwise Procedure로 다중회귀분석을 한 결과 의미있는 모형이 나왔습니다. 회귀방정식은 아래와 같습니다. Y = -1.837 + 0.003 X1 + 0.059 X2 -1.840 X3 + 4.890 X4 + 0.052 X5 + 0.014 X6 + 0.608 X7 Y = 1인당 도로부문 이산화탄소 배출량 X1 = 인구밀도 (1인당 시가지 면적(m2) ) X2 = 통근자중 미혼의 비율 X3 = 대중교통 통근자 비율 X4 = 1인당 자동차 대수 X5 = 도시공간상 인구분포의 확산정도(값이 높을수록 인구가 분산되어 있음) X6 = 1키로미터당 도로길이 X7 = 종사자 밀도의 지니계수(편중된 정도를 나타냄. 1에 가까우면 편중, 0에 가까우면 균등) 조정된 R2=0.78 입니다. 기본적인 회귀모형 설명이 가능합니다만 제가 하고 싶은 것은 인구밀도(X1)가 X2~X7를 통제 제어하였을 때 Y= constant + b1X1 라는 공식을 만들고 싶습니다. X2~X7 이 제어 또는 조정된 상태에서 단순회귀모델을 만들어서 인구밀도(X1) 값의 변화에 따라, 다른 독립변수가 통제되었을 때 종속변수(이산화탄소:Y)의 예측을 산포도와 상관계수, 회귀방정식을 보여주고, 인구밀도(X1)의 변화에 따른 다른 변수가 통제된 이산화탄소 배출량(Y)의 변화를 설명하고 싶습니다. 이렇게 특정 독립변수가 다른 독립변수를 제어 조정 하고 난 후에 종속변수에 영향을 미치는지를 방정식으로 표현하는 방법은 어떻게 하는지 알려주시면 대단히 고맙겠습니다. 이와 같은 분석을 하려는 이유는 다음 분석에서 경로분석을 하려고 하는데 적합한 이론을 구축해야 하기 때문에, 다른 독립변수가 제어 되었을 때, 특히, 인구밀도(1인당 시가지면적)가 어떻게 이산화탄소 배출량에 영향을 미치는지를 방정식을 만들어서 수를 대입하여 계산해보고 싶어서 그러는 것입니다. Hierarchical (or sequential) multiple regression 으로 이런 분석이 가능하다고 참고서적을 보니, 다른 독립변수가 제어 되었을때의 R2 change 로 variance (variation)의 양만 설명이 되어 있더군요. 제가 생각한 방법은 아래와 같은데 이런 방법도 사용이 가능할까요? (1) Stepwise Method로 얻은 회귀모델에 X1(인구밀도)을 70개 도시의 평균값으로 넣고 통제하고 싶은 독립변수X2~X7 는 실측 값을 넣어 Y(이산화탄소)의 계산합니다. 인구밀도의 평균을 사용하면 인구밀도가 변화가 없는 상태에서 70개 도시의 다른 독립변수의 영향에 의한 종속변수(이산화탄소) 값이라고 생각했습니다. (2) 예측된Y 값과 실측된 X1값(인구밀도)과 상관관계 및 단순회귀를 해본다. 위와 같이 하는 게 의미가 있는 건지도 모르겠고, 혼자서 괜히 이상한 방법 만드는거 같아서, 이런 경우에 적합한 방법이 있다면 알려주시면 좋겠습니다. 처음 시도한 방법은 위의 중회귀모델을 통해 나온 Unstandardized Predicted Value에 대하여 X1 과 X2 를 대입하여 단순회귀모델로 설명을 해보려고 한 시도입니다. 하지만, 역시 중회귀모델에 나온 값을 다시 단순회귀를 하니, 실제 Y (이산화탄소 배출량) 과의 상관성보다 Predicted Y 의 값이 더 높게 나오고 이건 독립변수를 제어 조정한 후에 특정 독립변수가 종속변수에 어떻게 영향을 미치는지의 방법이 아닌거 같아서 문의를 드려봅니다. 잘 부탁드리겠습니다. 행복한 세상 만드세요…