교차검증(통계) - Cross-validation (statistics)
출처: Cross-validation (statistics)
교차 검증, [2][3][4] 회전 추정 [5] [6] [7] 또는 샘플 외 테스트라고도 하는 는 다양한 유사한 모델 검증 기술 중 하나입니다. 통계 분석의 결과가 독립적인 데이터 세트로 일반화되는 방법을 평가합니다. 교차 검증에는 데이터의 다른 부분을 사용하여 서로 다른 반복에서 모델을 테스트하고 훈련하는 리샘플링 및 샘플 분할 방법이 포함됩니다. 예측이 목표인 환경에서 자주 사용되며 예측 모델이 실제로 얼마나 정확하게 수행될지 추정하려고 합니다. 또한 적합된 모델의 품질과 해당 매개변수의 안정성을 평가하는 데 사용할 수 있습니다.
예측 문제에서 모델에는 일반적으로 학습이 실행되는 알려진 데이터의 데이터 세트(학습 데이터 세트)와 모델을 테스트하는 알 수 없는 데이터(또는 처음 본 데이터)의 데이터 세트(검증 데이터 세트 또는 테스트 세트라고 함)가 제공됩니다. [8][9] 교차 검증의 목표는 과적합 또는 선택 편향과 같은 문제를 표시하고[10] 모델이 독립적인 데이터 세트(즉, 실제 문제에서 알 수 없는 데이터 세트)로 일반화되는 방법에 대한 통찰력을 제공하기 위해 추정에 사용되지 않은 새로운 데이터를 예측하는 모델의 기능을 테스트하는 것입니다.
한 차례의 교차 검증에는 데이터 샘플을 상호 보완적인 하위 집합으로 분할하고, 한 하위 집합(학습 집합이라고 함)에 대한 분석을 수행하고, 다른 하위 집합(검증 집합 또는 테스트 집합이라고 함)에 대한 분석을 검증하는 작업이 포함됩니다. 변동성을 줄이기 위해 대부분의 방법에서는 서로 다른 파티션을 사용하여 여러 차례의 교차 검증을 수행하고, 검증 결과를 라운드에 걸쳐 결합(예: 평균화)하여 모델의 예측 성능을 추정합니다.
요약하면, 교차 검증은 모델 예측 성능에 대한 보다 정확한 추정치를 도출하기 위해 예측의 적합성 측정을 결합(평균)합니다. [11]
동기 부여
하나 이상의 알 수 없는 매개변수가 있는 모델과 모델을 피팅할 수 있는 데이터 세트(학습 데이터 세트)를 가정합니다. 피팅 프로세스는 모델이 학습 데이터를 최대한 잘 피팅할 수 있도록 모델 매개변수를 최적화합니다. 학습 데이터와 동일한 모집단에서 검증 데이터의 독립적인 표본을 추출하면 일반적으로 모델이 학습 데이터에 적합할 뿐만 아니라 검증 데이터에도 적합하지 않은 것으로 판명됩니다. 이 차이의 크기는 특히 학습 데이터 세트의 크기가 작거나 모델의 매개 변수 수가 클 때 클 수 있습니다. 교차 검증은 이 효과의 크기를 추정하는 방법입니다. [ 인용 필요 ]
예: 선형 회귀[편집]
선형 회귀 분석에는 실제 반응 값이 존재합니다
, 및 n개의 p차원 벡터 공변량 x1, ..., xn. 벡터 xi의 구성 요소는 xi1, ..., xip로 표시됩니다. 최소 제곱을 사용하여 초평면 ŷ = a + βTx 형태의 함수를 데이터 (x, i, y, i) 1 ≤ i ≤ n에 피팅하는 경우 평균 제곱 오차(MSE)를 사용하여 피팅을 평가할 수 있습니다. 훈련 세트 (x, i, y, i) 1 ≤ i ≤ n에서 주어진 추정 매개변수 값 a 및 β에 대한 MSE는 다음과 같이 정의됩니다.
모델이 올바르게 지정된 경우 학습 세트에 대한 MSE의 기대값이 검증 세트에 대한 MSE의 기대값의 < 1배임을 가벼운 가정하에 표시할 수 있습니다(기대값은 학습 세트의 분포를 인수함). 따라서 훈련 세트에 대한 적합 모델 및 계산된 MSE는 모델이 독립적인 데이터 세트에 얼마나 잘 맞는지에 대한 낙관적으로 편향된 평가를 생성합니다. 이 편향된 추정치를 적합치의 표본내 추정치라고 하는 반면, 교차 검증 추정치는 표본 외 추정치입니다. [ 인용 필요 ]
선형 회귀에서는 모델 사양이 유효하다는 가정 하에 학습 MSE가 검증 MSE를 과소평가하는 요인 (n − p − 1)/(n + p + 1)을 직접 계산할 수 있으므로 모델이 과적합되었는지 여부를 확인하기 위해 교차 검증을 사용할 수 있습니다, 이 경우 검증 세트의 MSE가 예상 값을 크게 초과합니다. (선형 회귀의 맥락에서 교차 검증은 최적으로 정규화된 비용 함수를 선택하는 데 사용할 수 있다는 점에서도 유용합니다.)
일반적인 경우[편집]
대부분의 다른 회귀 프로시저(예: 로지스틱 회귀)에는 예상되는 표본 외 적합도를 계산하는 간단한 공식이 없습니다. 따라서 교차 검증은 이론적 분석 대신 수치 계산을 사용하여 사용할 수 없는 데이터에 대한 모델의 성능을 예측하는 데 일반적으로 적용 가능한 방법입니다.
유형[편집]
교차 검증의 두 가지 유형, 즉 Exhaustive와 Non-Exhaustive 교차 검증을 구별할 수 있습니다.
철저한 교차 검증[편집]
Exhaustive Cross-validation 방법은 원본 샘플을 훈련 세트와 검증 세트로 나누기 위해 가능한 모든 방법을 학습하고 테스트하는 교차 검증 방법입니다.
Leave-p-out 교차 검증[편집]
LpO CV(Leave-p-out cross-validation)는 p 관측값을 검증 세트로 사용하고 나머지 관측값을 훈련 세트로 사용하는 것을 포함합니다. 이는 p 관측치의 검증 세트와 훈련 세트에서 원래 표본을 절단하기 위해 모든 방법으로 반복됩니다. [12]
LpO 교차 검증에는 모델 학습 및 검증이 필요합니다.
시간, 여기서 n은 원래 표본의 관측치 수이고, 여기서
는 이항 계수입니다. p > 1 및 적당히 큰 n의 경우에도 LpO CV는 계산이 불가능해질 수 있습니다. 예를 들어, n = 100이고 p = 30인 경우
leave-pair-out 교차 검증으로 알려진 p=2를 사용한 LpO 교차 검증의 변형은 이진 분류기의 ROC 곡선 아래 면적을 추정하기 위한 거의 편향되지 않은 방법으로 권장되었습니다. [13]
Leave-one-out 교차 검증
교차 검증은 변수 선택에도 사용할 수 있습니다. [36] 암 환자가 약물에 반응할지 여부를 예측하기 위해 20개 단백질의 발현 수준을 사용한다고 가정해 보겠습니다. 실질적인 목표는 최상의 예측 모델을 생성하는 데 사용해야 하는 20개의 기능 중 어떤 하위 집합을 결정해야 하는지 결정하는 것입니다. 대부분의 모델링 절차에서 샘플 내 오류율을 사용하여 기능 하위 집합을 비교하면 20개의 기능을 모두 사용할 때 최상의 성능이 발생합니다. 그러나 교차 검증에서 가장 적합한 모델에는 일반적으로 실제로 유용한 것으로 간주되는 기능의 하위 집합만 포함됩니다.
최근 의학 통계의 발전은 메타 분석에 사용되는 것입니다. 이는 메타 분석 요약 추정치의 통계적 타당성을 테스트하는 데 사용되는 검증 통계 Vn의 기초를 형성합니다. [37] 또한 메타 분석 결과의 가능한 예측 오류를 추정하기 위해 메타 분석에서보다 전통적인 의미로 사용되었습니다. [38]
더 많은 자료 - 교차 검증 (통계)