회귀 트리 모델
hist(con$strength)
#4. 훈련 데이터와 테스트 데이터를 분리합니다.
library(caret)
set.seed(1)
train_num <- createDataPartition( con$strength, p=0.9, list=F)
train_data <- con[ train_num, ]
test_data <- con[ - train_num, ]
nrow( train_data )
nrow( test_data )
library(rpart)
model <- rpart( strength ~ . , data=train_data)
model
library(rpart.plot)
rpart.plot(model, digits=3)
#7. 훈련된 모델로 테스트 데이터를 예측
result<-predict(model, test_data[ ,-9])
result
#8. 모델 성능 평가
cor( result, test_data[ , 9] ) #74%
library(Cubist)
model2 <- cubist( x=train_data[ , -9], y=train_data[ ,9] )
model2
result2 <- predict( model2, test_data[ , -9] )
result2
cor( result2, test_data[ , 9] ) #93.38277%
library(randomForest)
set.seed(1)
model_rf<-randomForest( strength~., data=train_data, ntree=500,mtry=3)
model_rf
result_rf <- predict ( model_rf, test_data[ , -9] )
cor( result_rf, test_data[ ,9] ) # 96.84604%
74%-> 93.38277%-> 96.84604%