AI 모델은 COVID-19 테스트가 양성인지 여부를 사전에 예측합니다.
날짜:
2022년 12월 13일
원천:
플로리다 애틀랜틱 대학교
요약:
새로운 연구는 간단한 증상을 사용하여 훈련된 기계 학습 모델을 보여줍니다. 인구 통계학적 특징은 COVID-19 감염을 예측하는 데 효과적입니다.
COVID-19와 최신 Omicron 변종은 전국적으로뿐만 아니라 전 세계적으로 계속해서 감염을 일으킵니다. 혈청학(혈액) 및 분자 검사는 신속한 COVID-19 검사에 가장 일반적으로 사용되는 두 가지 방법입니다. COVID-19 테스트는 다양한 메커니즘을 사용하기 때문에 매우 다양합니다. 분자 검사는 바이러스 SARS-CoV-2 RNA의 존재를 측정하는 반면 혈청 검사는 SARS-CoV-2 바이러스에 의해 유발된 항체의 존재를 감지합니다.
현재 혈청학 검사와 분자 검사 간의 상관관계와 어떤 COVID-19 증상이 양성 검사 결과를 생성하는 데 중요한 역할을 하는지에 대한 기존 연구는 없습니다. 기계 학습을 사용하는 플로리다 애틀랜틱 대학의 공학 및 컴퓨터 과학 대학의 연구는 분자 테스트와 혈청 검사가 어떻게 상관관계가 있는지 이해하고 COVID-19 양성과 테스트 결과를 구별하는 데 가장 유용한 기능을 이해하는 데 중요한 새로운 증거를 제공합니다.
공학 및 컴퓨터 과학 대학의 연구원들은 COVID-19 테스트 결과를 예측하기 위해 5가지 분류 알고리즘을 훈련했습니다. 그들은 증상 발병 후 일수, 열, 온도, 연령 및 성별과 같은 인구 통계학적 특징과 함께 쉽게 얻을 수 있는 증상 특징을 사용하여 정확한 예측 모델을 만들었습니다.
이 연구는 단순한 증상 및 인구 통계학적 특성을 사용하여 훈련된 기계 학습 모델이 COVID-19 감염을 예측하는 데 도움이 될 수 있음을 보여줍니다. Smart Health 저널에 발표된 결과 는 COVID-19 감염과 관련된 주요 증상 특징을 식별하고 신속한 선별 및 비용 효율적인 감염 탐지 방법을 제공합니다.
연구 결과 발열 및 호흡 곤란과 같은 증상을 경험하는 일수가 COVID-19 테스트 결과에 큰 역할을 한다는 것이 밝혀졌습니다. 연구 결과는 또한 분자 검사가 혈청 검사의 증상 후 발병일(5~38일)에 비해 증상 후 발병일(3~8일)이 훨씬 더 짧다는 것을 보여줍니다. 결과적으로 분자 검사는 현재 감염을 측정하기 때문에 양성률이 가장 낮습니다.
또한 COVID-19 테스트는 부분적으로 다른 테스트 방법의 대상인 기증자의 면역 반응과 바이러스 부하가 지속적으로 변하기 때문에 크게 다릅니다. 동일한 기증자라도 두 가지 유형의 테스트에서 서로 다른 양성/음성 결과를 관찰하는 것이 가능할 수 있습니다.
Xingquan "Hill" Zhu, Ph.D.는 "분자 검사는 바이러스 부하에 의존하고 혈청 검사는 신체가 검출 가능한 수준의 항체를 생성하기 시작하는 기간인 혈청 전환에 의존합니다. 이 두 검사는 모두 시간 의존적입니다."라고 말했습니다. FAU 전기 공학 및 컴퓨터 과학과의 수석 저자 겸 교수. "우리의 결과는 증상 발현 후 일수가 양성 COVID-19 테스트에 매우 중요하며 환자를 선별할 때 신중하게 고려해야 함을 시사합니다."
연구를 위해 연구원들은 2,467명의 기증자의 테스트 결과를 사용했으며, 각각은 하나 또는 여러 유형의 COVID-19 테스트를 사용하여 테스트했으며, 테스트베드로 수집되었습니다. 그들은 증상과 인구 통계 정보를 결합하여 5가지 유형의 기계 학습 모델을 사용하여 예측 모델링을 위한 일련의 기능을 설계했습니다. 검사 유형과 결과를 교차 확인하여 혈청학 검사와 분자 검사 간의 상관 관계를 조사했습니다. 검사 결과 예측을 위해 2,467명의 기증자를 혈청학 또는 분자 검사 결과를 사용하여 양성 또는 음성으로 표시하고 기계 학습을 위해 각 기증자를 나타내는 증상 기능을 만들었습니다.
"COVID-19는 광범위한 증상을 일으키고 데이터 수집 프로세스는 본질적으로 오류가 발생하기 쉽기 때문에 유사한 증상을 빈으로 그룹화했습니다."라고 Zhu는 말했습니다. "증상 보고를 표준화하지 않으면 증상 특징 공간이 크게 증가합니다. 이를 해결하기 위해 샘플 특징 정보를 유지하면서 증상 특징 공간을 줄일 수 있는 이 비닝 접근 방식을 활용했습니다."
생성된 빈 기능을 5가지 기계 학습 알고리즘과 결합하여 사용함으로써 이러한 예측 모델은 81% 이상의 AUC 점수(가능한 모든 분류 임계값에 걸쳐 성능의 집계 측정을 제공하는 ROC 곡선 아래 영역)와 76% 이상의 AUC 점수를 달성했습니다. 퍼센트 분류 정확도.
"우리 테스트베드의 고유한 기능 중 하나는 일부 기증자가 여러 테스트 결과를 가질 수 있다는 것입니다. 이를 통해 혈청 검사와 분자 테스트 간의 관계를 분석하고 각 테스트 유형 내의 일관성을 이해할 수 있었습니다."라고 Zhu는 말했습니다.
연구원들이 사용하는 5가지 기계 학습 모델은 Random Forest, XGBoost, Logistic Regression, SVM(Support Vector Machine) 및 Neural Network입니다. 정확도, F1 점수 및 AUC의 세 가지 성능 메트릭을 사용하여 성능을 비교했습니다.
FAU 대학 학장인 Stella Batalama 박사는 "예측 모델링은 연구에서 답을 찾지 못한 많은 난해한 질문으로 인해 복잡합니다. 우리 연구원들이 만든 테스트베드는 참으로 참신하며 다양한 유형의 COVID-19 테스트 간의 상관관계를 명확하게 보여줍니다."라고 말했습니다. 공학 및 컴퓨터 과학. "저희 연구원들은 임상 해석 및 예측 모델링을 위해 시끄러운 증상 특징을 좁힐 수 있는 새로운 방법을 설계했습니다. 이러한 AI 기반 예측 모델링 접근 방식은 전염병 및 건강 문제의 다른 많은 측면을 퇴치하는 데 점점 더 강력해지고 있습니다."
출처 : https://www.sciencedaily.com/