연구팀은 COVID-19 저항성을 예측하기 위한 통계 모델을 생성합니다.
개념 증명 연구는 예측을 위해 전자 건강 데이터를 사용하는 기계 학습 시스템에 대한 가능성을 보여줍니다.
날짜:
2023년 2월 22일
원천:
존스 홉킨스 의학
요약:
연구원들은 누가 COVID-19를 유발하는 바이러스인 SARS-CoV-2에 노출되었음에도 불구하고 누가 COVID-19에 저항할 가능성이 가장 높은지 예측하기 위한 첫 번째 모델 중 하나라고 믿는 것을 만들고 예비 테스트했습니다.
전체 이야기
Johns Hopkins Medicine과 The Johns Hopkins University의 연구원들은 누가 SARS-CoV-2에 노출되었음에도 불구하고 COVID-19에 저항할 가능성이 가장 높은지 예측하기 위한 첫 번째 모델 중 하나라고 믿는 것을 만들고 예비 테스트했습니다. 일으키는 바이러스입니다.
이 연구는 저널 PLOS ONE 에 오늘 온라인으로 보고되었습니다 .
"어떤 사람들이 SARS-CoV-2 감염을 자연적으로 피할 수 있는지 확인할 수 있다면 사회적 및 행동적 요인 외에도 어떤 유전적 및 환경적 차이가 바이러스에 대한 방어에 영향을 미치는지 알 수 있을 것입니다." Johns Hopkins University의 Translational Informatics Research and Innovation Lab의 생물 의학 공학 대학원생인 수석 연구 저자인 Karen (Kai-Wen) Yang은 말합니다. "그 통찰력은 새로운 예방 조치와 보다 고도로 표적화된 치료로 이어질 수 있습니다."
연구를 위해 연구팀은 기계 학습 통계 모델이 전자 건강 기록에 저장된 건강 특성을 사용할 수 있는지 확인하기 시작했습니다. 동반 질환(기타 의학적 상태) 및 처방약과 같은 환자 데이터를 제공하여 SARS-CoV-2 감염을 피할 수 있는 타고난 능력이 있는 사람. 그러한 사람들은 그들의 저항을 가능하게 하는 요인을 더 잘 이해하기 위해 연구될 수 있다고 Yang은 말합니다.
기계 학습 모델은 수학적 알고리즘을 사용하여 통계적 패턴을 찾은 다음 앞으로 나아가는 패턴을 적용하는 컴퓨터 프로그램 또는 시스템입니다. 이것은 그러한 시스템이 인간의 사고와 추론을 모방하고 뇌와 유사하게 시간이 지남에 따라 학습할 수 있는 능력을 제공합니다.
"COVID-19에 걸린 많은 사람들의 복잡한 패턴을 인식하기 위해 기계 학습 시스템을 사용하여 2021년 Johns Hopkins Medicine 연구원의 또 다른 팀이 개별 환자의 사례 경과를 예측하고 심각해질 가능성을 결정할 수 있었습니다." 공동 선임 연구 저자인 Stuart Ray, MD는 데이터 무결성 및 분석을 위한 의학 부의장이자 Johns Hopkins University School of Medicine의 의학 교수라고 말했습니다. "그들의 성공을 바탕으로, 우리 팀은 누가 가까운 곳에서 SARS-CoV-2에 노출되고 여전히 감염되지 않을 수 있는지 예측하는 데 동일한 접근 방식을 적용할 수 있는지 궁금했습니다."
COVID-19 저항을 예측하는 모델의 능력을 입증하기 위해 연구자들은 먼저 Johns Hopkins COVID-19 Precision Medicine Analytics Platform Registry(JH-CROWN)라는 임상 레지스트리에서 데이터를 수집했습니다. 레지스트리에는 SARS-CoV-2 감염이 의심되거나 감염된 것으로 확인된 Johns Hopkins Health System 내에서 확인된 환자에 대한 정보가 포함되어 있습니다.
저항성 연구를 위해 연구원들은 2020년 6월 10일부터 2020년 12월 15일 사이에 COVID-19 테스트를 받았고 "바이러스에 대한 잠재적 노출"을 테스트 이유로 보고한 개인만 포함했습니다.
종료일은 미국에서 대규모 COVID-19 백신 접종 노력이 시작된 시점이었습니다. 연구원들은 이 날짜를 선택함으로써 자연 저항보다는 감염을 예방하는 백신의 발견에 미치는 영향을 피할 수 있었다고 말합니다.
COVID 검사를 받는 이유로 노출을 보고한 8,536명의 연구 참가자는 두 그룹으로 나뉘었습니다. 환자; 그리고 10명 이하의 사람들과 거주지를 공유하고 적어도 한 명은 COVID-19 환자입니다. 8,476명의 참가자로 구성된 첫 번째 그룹은 훈련 및 테스트 세트로 지정되었고, 두 번째 그룹인 가구 지수(HHI) 세트는 60명의 구성원으로 별도의 테스트 세트로 사용되었습니다.
연구원들은 가구 수를 10명 이하로 유지하면서 SARS-CoV-2에 양성 반응을 보이는 특정 사람에 대한 노출이 덜 강할 아파트 단지, 기숙사 및 기타 고밀도 다세대 생활 공간에 거주하는 사람들을 제외했다고 말했습니다.
SARS-CoV-2에 자연적으로 저항하는 참가자가 눈에 띄도록 패턴 및 클러스터 참가자를 식별하기 위해 MASPC(Maximal-frequent All-confident Pattern Selection Pattern-based Clustering) 알고리즘을 사용하여 두 연구 세트를 분석했습니다. MASPC는 환자 인구통계학적 정보(연령, 성별, 인종), 각 사례와 관련된 ICD(International Statistical Classification of Diseases and Related Health Problems) 의료 진단 코드, 외래 환자 약물 처방 및 번호를 결합한 전자 건강 기록 데이터 분석을 위해 특별히 설계되었습니다. 동반이환(기타 질병)이 존재합니다.
"우리는 MASPC를 사용하면 데이터에서 유사한 패턴을 가진 환자를 클러스터링하여 SARS-CoV-2에 대한 저항성 및 비저항성을 정의할 수 있고 알고리즘이 각 분석을 통해 정확도를 개선하는 방법을 학습할 것이라는 희망을 가지고 가설을 세웠습니다. 미래 과제의 신뢰성"이라고 Ray는 말합니다. "JH-CROWN 데이터를 사용한 이 초기 연구는 COVID-19에 대한 저항성이 환자의 임상 및 인구 통계학적 프로필을 기반으로 예측 가능할 수 있음을 보여주는 통계 모델의 개념 증명 시험인 가설에 생명을 불어넣기 위해 수행되었습니다."
"트레이닝 및 테스트 세트에서 ICD 코드의 56개 패턴이 저항과 관련되거나 관련되지 않은 두 그룹으로 나뉘는 것을 확인했습니다."라고 Yang은 말합니다. "이러한 패턴이 저항과 비저항을 얼마나 잘 구별하는지에 대한 통계 분석은 SARS-CoV에 노출되었을 가능성이 가장 높은 사람을 정의하기 위해 소규모의 지역화된 [Baltimore-Washington, DC, Metroplex] 연구 모집단에 가장 적합한 5가지 패턴을 산출했습니다. -2."
Ray는 "가까운 분기에 SARS-CoV-2에 노출되었을 가능성이 가장 높은 HHI 세트에서 이러한 패턴을 찾은 다음 결과를 통계적으로 분석한 결과 우리 모델의 최고 성능은 0.61이었습니다"라고 말했습니다. Ray는 "0.5점은 예측과 현실 사이의 우연한 연관성만 보여주고 1은 100% 연관성을 나타내므로 이 모델이 추가 연구가 가능한 COVID-19 저항성을 가진 사람들을 식별하는 도구로서 가능성이 있음을 보여줍니다."라고 Ray는 말합니다.
Ray는 연구의 한계에는 참가자의 COVID-19 노출에 대한 자가 보고, HHI 그룹의 소수 참가자, 참가자가 가정 키트를 사용하거나 시설에서 SARS-CoV-2에 대해 테스트할 가능성으로 인한 잠재적 편견이 포함된다고 말합니다. Johns Hopkins 시스템 외부(따라서 JH-CROWN 데이터베이스에 테스트가 기록되지 않음) 및 연구 자체의 짧은 기간. 그는 모델의 능력을 검증하기 위해 국가 환자 데이터를 사용한 향후 추적이 필요하다고 덧붙였습니다.
Johns Hopkins Medicine 및 Johns Hopkins University의 연구 팀 구성원은 Yang 및 Ray와 함께 Yijia Chen, Jacob Desman, Kevin Gorman, Chloé Paris, Ilia Rattsev, Tony Wei 및 Rebecca Yoo입니다. 교수진 공동 선임 저자 Joseph Greenstein과 Casey Overby Taylor.
연구 저자는 이해 상충이 없다고 보고합니다.
출처 : https://www.sciencedaily.com/