품질만족에 영향을 주는 회귀분석에서 종속변수가 품질불량 여부가 되는데, 기준이 86.5+-0.3 즉, 86.2~86.8이면 만족인데, 이를 만족이면 0, 구간을 벗어나면 1로 놓고 Logistic Regression 분석을 하면 되는것으로 알고 있습니다.
그런데, 방법을 달리해서 그냥 품질측정 값(86.5등등)을 종속변수로 놓고 회귀식을 만들어도 괜찮은 분석방법인지 알고 싶구요.
두번째는, 독립변수에 년도, 월도 있는데 나머지 독립변수와 함께 년도, 월이 독립변수로 들어가도 방법이 괜찮은건지 궁금합니다.
즉, 회귀식이
종속변수 = (회귀계수)년도 + (회귀계수)월 + (회귀계수)품질영향변수 + •••• + 절편
이렇게 년, 월도 독립변수로 들어가는 거죠.^^
괜찮은건지, 아니면 품질에 영향을 주는 요인이라고 보기 어려우므로 년,월은 독립변수로 안 넣어야 하는건지 문의드립니다. 감사합니다.^^
첫댓글 년, 월을 넣어야하는지는 그쪽을 잘 몰라서 모르겠고요.
품질측정의 값을 y라고 하죠. 불량의 정도가 y가 커질수록 증가하거나 반대로 y가 작아질수록 증가한다면 y를 종속변수로 사용해도 됩니다. 그러나 이 경우는 86.5를 기준으로 멀어질수록 불량의 정도가 커지므로, 그냥 |y-86.5|를 종속변수로 사용하는게 가장 그럴듯할것같습니다. 이것도 y의 분포가 86.5를 기준으로 어느정도 대칭일때 사용할 수 있습니다. 즉 (86.5-k)와 (86.5+k)가 느낌상 비슷한 불량정도를 나타내야합니다.
네~ 답변 감사합니다.
그리고 년,월을 통상 일반적 독립변수로 넣는지 질문 드리는 거구요.^^