# 예측 데이터 제외, 실제 데이터 끼리 상관 관계 비교
tyR <- ty[ty$EXP_TIME == 0, ]
cor(tyR$C_PRESS, tyR$V_KMH) # -0.9808801
# 왜도 구해보기
install.packages("fBasics")
library(fBasics)
skewness(tyR$C_PRESS) # -0.6927138
hist(tyR$C_PRESS)
# 왜도값이 -0.69로 음수값이 나왔으므로 그래프가 왼쪽꼬리분포
graphics.off()
install.packages("e1071") # 첨도값 확인하는 패키지
library(e1071)
result <- kurtosis(tyR$C_PRESS) # 첨도값 확인하는 함수
print(result) # -0.4919851
hist(tyR$C_PRESS)
# 첨도값은 -0.4919851이 나왔는데 3을 더해보면 2.5080149가 나온다
# 3보다 작으므로 완만한 곡선이지만 3에 가까운 숫자이다
# 두 변수의 산포도 그래프 그려보기
plot(tyR$C_PRESS, tyR$V_KMH, pch=21, col='red', bg='red')
# 추세선 추가해서 그리기
# 산포도 그래프 생성
fig <- plot_ly(data = tyR,
x = ~C_PRESS, # x축
y = ~V_KMH, # y축
type = 'scatter',
mode = 'markers',
marker = list(color = 'blue'))
# 추세선 추가 (%>% : 파이프)
fig <- fig %>% add_trace(x = tyR$C_PRESS, # x 축
y = fitted(lm(V_KMH ~ C_PRESS, data=tyR)), # y축
# lm=선형회귀분석 / price 종속변수 year 독립변수 / fitted - 회귀 예측 값을 y축 좌표로 사용한다는 뜻
type = 'scatter',
mode = 'lines', # 점과 점을 선으로 연결하겠다
line = list(color='red'),
name = 'Trend Line')
# 그래프 출력
fig