# 데이터 로드 (변속기가 수동인지 자동인지를 분류하기 위한 데이터)
bin<-read.csv('c:\\data\\binary.csv', header = T)
str(bin)
nrow(bin)
# 필요한 변수만 선택
bin$admit <- as.factor(bin$admit)
head(bin)
bin$admit
# 훈련 데이터와 테스트 데이터를 분리
library(caret)
set.seed(123)
train_num <- createDataPartition(bin$admit, p = 0.8, list = FALSE)
train_data <- bin[train_num,]
test_data <- bin[-train_num,]
normalize <- function(x) {
return ( ( x-min(x) ) / ( max(x) - min(x) ) )
}
train_data_n <- as.data.frame( lapply( train_data[ , -1], normalize) )
test_data_n <- as.data.frame( lapply( test_data[ , -1], normalize) )
train_data_n<- cbind(admit=train_data[,1], train_data_n)
test_data_n<- cbind(admit=test_data[,1], test_data_n)
summary(train_data_n)
summary(test_data_n)
nrow(train_data)
nrow(test_data)
C_values <- c(1:100)
C_values
gamma_values <- 2^(-20:-1)
gamma_values
results <- data.frame( C=numeric(), gamma=numeric(), accuracy=numeric() )
for ( C in C_values) {
for ( gamma in gamma_values) {
# 모델 생성 및 하이퍼파라미터 설정
library(e1071)
# C와 gamma 값을 조정하여 모델 훈련
set.seed(1)
model <- svm(admit ~ ., data = train_data_n, kernel = "radial", cost = C, gamma = gamma)
# 모델 예측
result <- predict(model , test_data_n[, -1]) # 정답제외하고 예측함
# 모델 평가
accuracy <- sum(result == test_data_n$admit) / length(test_data_n$admit)
results <- rbind( results, data.frame(C=C, gamma=gamma, accuracy=accuracy))
}
}
orderBy(~ -accuracy, results)
results