**전이학습(Transfer Learning)**은 한 도메인에서 학습한 모델이나 정보를 다른 도메인 또는 작업에 재사용하는 기계학습 기법입니다. 이 방법은 특히 데이터가 부족하거나 모델 훈련에 시간이 오래 걸리는 상황에서 효과적입니다.
주요 개념
1. 특징 재사용
이미 학습된 모델(예: 대규모 데이터셋으로 학습된 모델)의 가중치를 새로운 문제에 적용합니다. 이를 통해 새로 학습할 모델이 적은 데이터로도 성능을 높일 수 있습니다.
2. 사전 학습 모델(Pre-trained Model)
대규모 데이터셋(예: ImageNet, GPT 등)으로 사전 학습된 모델을 새로운 작업에 맞게 조정(Fine-tuning)하거나, 해당 모델의 일부를 사용합니다.
3. 세 가지 주요 방식:
미세 조정(Fine-Tuning): 기존 모델의 가중치를 초기화 값으로 사용하고, 새로운 데이터에 맞게 학습을 이어감.
고정 특징 추출(Feature Extraction): 기존 모델의 가중치는 고정하고 새로운 작업에 대한 분류기만 학습.
프리트레인-파인트윅(Pretrain-Finetune): 모델을 먼저 비슷한 작업으로 학습시키고, 이후 특정 작업에 대해 미세 조정.
적용 사례
1. 컴퓨터 비전
이미지 분류, 객체 탐지 등에 ImageNet으로 사전 학습된 모델 사용.
2. 자연어 처리(NLP)
BERT, GPT 등으로 학습된 언어 모델을 사용하여 문서 분류, 번역, 요약 등의 작업에 활용.
3. 음성 인식 및 처리
대규모 음성 데이터로 학습된 모델을 다른 언어 또는 음성 관련 작업에 적용.
4. 강화학습
이전 작업에서 학습한 전략을 유사한 환경이나 문제에 적용.
장점
효율성: 데이터와 학습 시간 절감.
성능 개선: 적은 데이터로도 좋은 결과 도출 가능.
범용성: 다양한 도메인에 모델 재사용 가능.
한계
도메인 간격(Domain Gap): 출발 도메인과 대상 도메인의 차이가 크면 성능 저하.
오버피팅: 작은 데이터셋에 과적합 가능성.
설계 복잡성: 적절한 미세 조정 및 계층 선택이 필요.
전이학습은 현재 딥러닝과 AI 모델 개발의 핵심 기술로 자리 잡고 있으며, 다양한 산업 분야에서 활용되고 있습니다.