저번 글에서 데이터가 homogeneity of variances assumption을 만족하는지 알아보기 위해 histogram을 그려보았습니다.
이번 글에서는 데이터가 homogeneity of slopes assumption을 만족하는지 알아보기 위해 scatter diagram을 그려보겠습니다.
1. 데이터의 histogram에 대한 분석

부모님의 수입에 따른 학생들의 성적 분석을 위해 위와 같은 데이터를 엑셀에 입력해보았습니다.

그리고 성적에 대한 histogram을 그려보았습니다. 4개 모두 상대적으로 대칭이고 육안으로 보았을 때 분산 또한 크게 다르지 않습니다. 엑셀에서 계산했을때는 각각 134.125, 164.7857, 105.6556, 48.8444으로 homogeneity of variances assumption라는 것을 만족합니다.
2. 데이터의 scatter diagram 그리기

엑셀 상단 옵션의 삽입 - 분산형 - 표식만 있는 분산형을 선택합니다.

그러면 이렇게 빈 사각형이 하나 생성되는데 여기에 마우스를 위치하고 오른쪽 클릭 - 데이터 선택을 누릅니다.

이런 화면이 나타나는데 추가 버튼을 누릅니다.

나타나는 창을 위와 같이 설정을 해야 하는데 계열 이름은 엑셀에 입력한 Method1, Method2, Method3, Method4이고,
계열 X 값은 부모님의 수입을 나타내는 Income의 열 데이터, 계열 Y값은 학생의 성적을 나타내는 Score의 열 데이터입니다.

Method1의 계열 이름 설정

Method1의 X축 설정

Method1의 Y축 설정

Method1에 대한 scatter diagram

Method1의 scatter diagram에 나머지도 같은 방법으로 추가합니다. 그러면 위와 같이 그래프가 나오겠습니다.
3. scatter diagram에 선 그리기
scatter diagram에 선을 추가하여 데이터가 homogeneity of slopes assumption을 만족하는지 알아보겠습니다.

scatter diagram에서 선을 그리고 싶은 점들 중 하나를 클릭하면 이렇게 전체가 선택됩니다.

점들 중 하나에 마우스를 위치하고 오른쪽 클릭을 누른후 추세선 추가를 누릅니다.

그러면 점들에 해당하는 선이 그려지는데 색상을 직접 정해줘야 합니다. 같이 나타나는 창에서 점의 색상에 맞는 색상을 선택해줍니다.
3. scatter diagram 분석

4종류의 점들 모두에 선을 그린 모습입니다. 선들이 모두 평행하지는 않지만 거의 평행이므로 homogeneity of slopes assumption을 만족합니다.
추가로 해야 할 분석이 몇 가지 더 있는 것 같은데 추후 같이 올리면 좋을 것 같습니다.
4. 엑셀 파일 첨부
ANCOVA.xlsx