AI는 환자 데이터를 공유하지 않고도 대규모 뇌종양 연구를 가능하게 합니다.
날짜:
2022년 12월 5일
원천:
펜실베니아 대학교 의과대학
요약:
연구원들은 전 세계 71개 지역에서 6,314명의 교모세포종(GBM) 환자의 뇌 스캔에서 얻은 지식을 안전하게 집계하고 세 개의 종양 하위 구획에서 경계 식별 및 예측을 향상시킬 수 있는 모델을 개발하기 위해 대규모 글로벌 기계 학습 노력을 주도했습니다. 환자 개인정보 침해.
Penn Medicine과 Intel Corporation의 연구원들은 전 세계 71개 사이트에서 6,314명의 교모세포종(GBM) 환자의 뇌 스캔에서 얻은 지식을 안전하게 집계하고 경계 식별 및 예측을 향상할 수 있는 모델을 개발하기 위해 가장 큰 규모의 글로벌 기계 학습 노력을 주도했습니다. 환자의 사생활을 침해하지 않고 3개의 종양 하위 구획에 있습니다. 그들의 연구 결과는 오늘 Nature Communications 에 발표되었습니다 .
"이것은 문헌에서 고려된 교모세포종 환자의 단일 데이터 세트 중 가장 크고 가장 다양한 것이며, 연합 학습을 통해 가능해졌습니다." 펜실베이니아 대학교의 Perelman School of Medicine. "머신 러닝 모델에 데이터를 더 많이 입력할수록 정확도가 높아져 환자의 교모세포종을 더 정확하게 이해하고 치료하고 제거하는 능력이 향상될 수 있습니다."
공격적인 유형의 뇌종양인 GBM과 같은 희귀한 조건을 연구하는 연구원은 종종 자신의 기관이나 지리적 위치로 환자 모집단을 제한합니다. 미국의 HIPAA(Health Insurance Portability and Accountability Act of 1996) 및 유럽의 일반 데이터 보호 규정(GDPR)과 같은 개인 정보 보호 법률로 인해 환자 개인 정보 데이터를 손상시키지 않고 기관 간 데이터 공유 협업이 주요 장애물입니다. 많은 의료 서비스 제공자에게.
연합 학습이라고 하는 새로운 기계 학습 접근 방식은 데이터를 알고리즘에 중앙 집중화하는 현재 패러다임을 따르는 대신 기계 학습 알고리즘을 데이터에 가져와 이러한 장애물에 대한 솔루션을 제공합니다. 키보드의 자동 수정 기능을 위해 Google에서 처음 구현한 접근 방식인 연합 학습은 로컬 데이터 샘플을 실제로 교환하지 않고 여러 분산 장치 또는 서버(이 경우 기관)에서 기계 학습 알고리즘을 교육합니다. 이전에는 다른 국가에 있는 기관의 임상의가 개인 환자 데이터를 공유하지 않고도 연구에 협력할 수 있는 것으로 나타났습니다.
Bakas는 첫 번째 저자인 Penn's Center for Biomedical Image Computing & Analytics(CBICA)의 선임 소프트웨어 개발자인 Sarthak Pati, MS, CBICA의 박사후 연구원인 Ujjwal Baid, PhD, Brandon Edwards, PhD, 연구와 함께 이 대규모 공동 연구를 이끌었습니다. Intel Labs의 과학자이자 Intel Labs의 연구 과학자인 Micah Sheller입니다.
"데이터는 특히 사용 가능한 데이터가 부족할 수 있는 희귀 암에서 발견을 촉진하는 데 도움이 됩니다. 우리가 요약한 연합 접근 방식을 통해 데이터 공유에 대한 제도적 부담을 줄이면서 최대 데이터에 액세스할 수 있습니다." Case Western Reserve University School of Medicine의 겸임 교수인 Jill Barnholtz-Sloan 박사는 말했습니다.
이 모델은 단계별 접근 방식을 따랐습니다. 공개 초기 모델 이라고 하는 첫 번째 단계는 BraTS(International Brain Tumor Segmentation) 챌린지에서 공개적으로 사용 가능한 데이터를 사용하여 사전 훈련되었습니다. 이 모델은 3개의 GBM 종양 하위 구획의 경계를 식별하는 임무를 맡았습니다. "종양 코어"(TC)는 ET 및 조직을 죽이는 부분을 포함하고 이를 제거하는 외과의와 관련된 종양 부분을 나타냅니다. 및 "전체 종양"(WT)은 TC와 방사선으로 치료될 전체 영역인 침윤된 조직의 결합에 의해 정의됩니다.
이것은 먼저 16개 사이트에서 231명의 환자 사례 데이터를 얻었고 결과 모델은 각 사이트의 로컬 데이터에 대해 검증되었습니다. 예비 합의 모델 이라고 하는 두 번째 단계는 공개 초기 모델을 사용하고 35개 사이트의 2,471명의 환자 사례에서 더 많은 데이터를 통합하여 정확도를 높였습니다. 최종 단계 또는 최종 합의 모델은 업데이트된 모델을 사용하고 6개 대륙에 걸쳐 71개 사이트에서 6,314건의 환자 사례(3,914,680개 이미지)에서 가장 많은 양의 데이터를 통합하여 보이지 않는 데이터에 대한 일반화 가능성을 추가로 최적화하고 테스트했습니다.
각 단계에 대한 통제로서 연구원들은 각 참여 사이트에서 기여한 전체 사례의 20%를 모델 교육 프로세스에서 제외하고 "로컬 검증 데이터"로 사용했습니다. 이를 통해 협업 방법의 정확성을 측정할 수 있었습니다. 모델의 일반화 가능성을 추가로 평가하기 위해 590개 사례의 완전히 보이지 않는 "샘플 외" 데이터 모집단을 나타내기 위해 6개 사이트가 훈련 단계에 관여하지 않았습니다. 특히 American College of Radiology 사이트는 국가 임상 시험 연구의 데이터를 사용하여 모델을 검증했습니다.
모델 교육 후 최종 합의 모델은 협력자의 로컬 검증 데이터에 비해 상당한 성능 향상을 얻었습니다. 최종 합의 모델은 ET 경계 감지에서 27%, TC 경계 감지에서 33%, WT 경계 감지에서 16% 개선되었습니다. 개선된 결과는 모델을 개선할 뿐만 아니라 검증하기 위해 더 많은 사례에 액세스함으로써 얻을 수 있는 이점을 명확하게 나타냅니다.
앞으로 저자는 연합 학습의 일반적인 방법론으로 인해 의학 연구에서의 응용 프로그램이 다른 암뿐만 아니라 신경 퇴행과 같은 다른 조건 등에 광범위하게 적용될 수 있기를 바랍니다. 그들은 또한 연합 학습이 전 세계의 보안 및 개인 정보 프로토콜을 준수할 수 있음을 입증하기 위해 더 많은 연구를 기대합니다.
출처 : https://www.sciencedaily.com/