# CSV 파일 읽기
multi_hg <- read.csv('c:\\data\\multi_hg.csv', header = T, fileEncoding = 'euc-kr')
head(multi_hg) # 데이터프레임의 첫 6행 출력
nrow(multi_hg) # 데이터프레임의 총 행 개수 출력
summary(multi_hg) # 데이터프레임의 기술 통계 출력
# psych 패키지 설치 및 로드
install.packages("psych") # psych 패키지 설치
library(psych) # psych 패키지 로드
# 다중 산점도 행렬 생성 (피어슨 상관계수 설정)
pairs.panels(
multi_hg, # 입력 데이터: multi_hg 데이터프레임
method = "pearson", # 상관계수 계산 방법: 피어슨 (산포도 그래프를 이용해서 상관계수를 구한다면, 일반적으로는 피어슨 상관계수가 사용된다.) (디폴트)
hist.col = "lightblue", # 히스토그램 막대 색상: 연파랑
main = "스마트폰 만족도와 타변수의 관계 (피어슨 상관계수)", # 그래프 제목
pch = "♥", # 산점도의 점 모양: 하트
lm = TRUE, # 산점도에 회귀선 추가 (디폴트)
ellipses = TRUE # 산점도에 95% 신뢰 타원 추가 (디폴트)
)
전체적인 결론
: '외관'과 '만족감' 변수 사이에서 가장 높은 상관계수(0.51)을 가진다. 이는 '외관'이 전체적인 만족도에 중요한 영향을 미칠 가능성이 있다.
추가 고려사항
- 상관계수는 변수 간의 선형관계를 나타낼 뿐, 인과 관계를 보장하지 않는다.
- '외관'이 '만족감'을 높이는 직접적인 원인인지 추가분석 (예 : 회귀분석)이 필요하다.