# 패키지 설치 (한번만 실행하면 됩니다) install.packages("randomForest")
# 패키지 로드 library(randomForest)
# iris 데이터셋 로드 data(iris)
# 데이터 확인 head(iris)
# 데이터셋을 랜덤하게 섞고, 70%를 훈련 데이터, 30%를 테스트 데이터로 분리 set.seed(42) # 랜덤 시드 설정 (재현 가능성 위해) train_indices <- sample(1:nrow(iris), 0.7 * nrow(iris))
train_data <- iris[train_indices, ] test_data <- iris[-train_indices, ]
# 랜덤 포레스트 모델 학습 rf_model <- randomForest(Species ~ ., data=train_data, ntree=100, mtry=2, importance=TRUE)
# 모델 요약 정보 확인 print(rf_model)
# 테스트 데이터에 대한 예측 수행 predictions <- predict(rf_model, test_data)
# 혼동 행렬(Confusion Matrix) 확인 confusion_matrix <- table(predictions, test_data$Species) print(confusion_matrix)
# 정확도 계산 accuracy <- sum(diag(confusion_matrix)) / sum(confusion_matrix) print(paste("Accuracy:", accuracy))
# 변수 중요도 확인 importance(rf_model)
# 변수 중요도 시각화 varImpPlot(rf_model) |