러닝에서 자주 사용되는 알고리즘
머신 러닝에서 자주 사용되는 알고리즘들은 문제의 유형(예측, 분류, 군집 등)에 따라 다양하게 쓰입니다.
■ 머신 러닝에서 자주 사용되는 알고리즘
1. 선형 회귀 (Linear Regression)
- 용도: 연속적인 값을 예측할 때 사용 (예: 집값, 온도)
- 특징: 입력 변수와 출력 변수 사이의 선형 관계를 모델링
2. 로지스틱 회귀 (Logistic Regression)
- 용도: 이진 분류 문제 (예: 이메일이 스팸인지 아닌지)
- 특징: 확률 기반으로 분류, 결과는 0 또는 1
3. 의사결정 나무 (Decision Tree)
- 용도: 분류 및 회귀 문제
- 특징: 질문을 통해 데이터를 분할하며 예측
4. 서포트 벡터 머신 (SVM)
- 용도: 분류 문제에 강력함
- 특징: 데이터 간의 경계선을 최대한 넓게 설정
5. 신경망 (Neural Networks)
- 용도: 이미지 인식, 음성 인식 등 복잡한 문제
- 특징: 인간 뇌의 뉴런 구조를 모방한 모델
6. K-최근접 이웃 (K-Nearest Neighbors, KNN)
- 용도: 분류 및 회귀
- 특징: 가장 가까운 데이터 포인트들을 기준으로 예측
7. 나이브 베이즈 (Naive Bayes)
- 용도: 텍스트 분류, 스팸 필터링
- 특징: 조건부 확률 기반, 계산이 빠르고 간단함
8. 군집화 (Clustering, 예: K-Means)
- 용도: 비지도 학습, 데이터 그룹화
- 특징: 유사한 데이터끼리 묶음 (예: 고객 세분화)
9. 랜덤 포레스트 (Random Forest)
- 용도: 분류 및 회귀
- 특징: 여러 개의 결정 트리를 조합해 예측 정확도 향상
10. XGBoost / LightGBM
- 용도: 고성능 예측 모델 (캐글 대회 등에서 인기)
- 특징: 부스팅 기법을 활용한 앙상블 모델, 빠르고 정확함
이 알고리즘들은 각각의 문제 유형과 데이터 특성에 따라 선택됩니다. 예를 들어, 이미지나 음성 같은 복잡한 데이터에는 신경망이, 간단한 예측에는 선형 회귀가 적합합니다.