# [1] "4 일 때 trian 의 정확도는 100 % test 의 정확도는 100 %"
(개인 코드에 동료 승욱의 코드를 참고해서 개선했습니다.)
setwd('c:\\data')
data9 <- read.csv('wine2.csv', stringsAsFactors = T)
head(data9)
str(data9)
colSums(is.na(data9))
table(data9$Type)
library(caret)
set.seed(1)
train_idx <- createDataPartition(data9$Type, p = 0.8, list = F)
train_data9 <- data9[train_idx, ]
test_data9 <- data9[-train_idx, ]
library(C50)
model9 <- C5.0(train_data9[ ,c(-1)],train_data9[,1])
model9
summary(model9)
plot(model9)
train_result9 <- predict( model9, train_data9[ , c(-1) ] )
sum( train_result9 == train_data9[ , 1] ) / 143 * 100 # 99.3007
test_result9 <- predict(model9, test_data9[ ,c(-1)])
sum(test_result9 == test_data9[ , 1] ) / 34 * 100 # 94.11765
y <- 0
jumpby <- 1
for ( i in 1:50){
y <- y + jumpby
model8 <- C5.0(train_data9[ , c(-1) ] , train_data9[ ,1], trials = y)
train_result8 <- predict( model8, train_data9[ , c(-1) ] )
m <- sum( train_result8 == train_data9[ , 1] ) / 143 * 100
test_result8 <- predict(model8, test_data9[ ,c(-1)])
n <- sum(test_result8 == test_data9[ , 1] ) / 34 * 100
print(paste(y, '일 때 trian 의 정확도는', m ,'%' , 'test 의 정확도는' , n , '%'))
}
# [1] "4 일 때 trian 의 정확도는 100 % test 의 정확도는 100 %"