|
SARS-CoV-2 바이러스 샘플은 전 세계적으로 매우 다양한 속도로 시퀀싱됩니다. 크레딧: Prabin Ranabhat/SOPA 이미지/LightRocket/게티
SARS-CoV-2 게놈을 시퀀싱하는 많은 국가는 공개 리포지토리에서 그 중 일부만 공유하고 있으며 게놈 감시에 대한 글로벌 분석에 따르면 많은 시퀀스에서 중요한 정보가 누락되어 있습니다. 그러나 이 연구는 이러한 도전에도 불구하고 국가들이 팬데믹 과정에서 시퀀스를 공유하는 데 더 빨라졌다는 것을 발견했습니다.
SARS-CoV-2 샘플의 게놈 시퀀싱 데이터를 공개적으로 공유함으로써 연구자들은 바이러스가 어떻게 진화하고 있는지 추적할 수 있었고 전염병의 특징이 되었습니다. 그러나 연구자들은 데이터 격차로 인해 우려의 다음 COVID-19 변종을 발견하기가 더 어려워지고 신속하게 대응하려는 노력이 좌절될 수 있다고 우려하고 있습니다.
Colombo에 있는 University of Sri Jayewardenepura의 면역학자인 Neelika Malavige는 "데이터 공유는 모든 사람의 생존을 위해 절대적으로 중요합니다."라고 말합니다.
이번 주 네이처 제네틱스(Nature Genetics )에 발표된 연구 1 에서 연구원들은 대유행 시작과 2021년 10월 31일 사이에 GISAID를 포함한 공개 리포지토리에 업로드된 게놈 데이터를 수집했습니다.
원천:
그들은 이러한 시퀀스를 개별 국가의 공식 보고서와 비교했으며 해당 데이터를 보고한 62개 국가 중 23개(1/3 이상)가 우려되는 Alpha, Beta, Gamma 및 Delta 변종에서 시퀀스의 50% 미만을 업로드했음을 발견했습니다. (숨겨진 변종 참조). 약 1/4의 국가에서 시퀀스의 25% 미만을 업로드했습니다. 공동 저자인 메릴랜드주 볼티모어에 있는 존스 홉킨스 대학의 전염병 역학자인 앤드류 아즈먼은 공유 부족이 세계적인 문제라고 말합니다. "그냥 부자나 가난한 나라의 문제가 아닙니다."
처벌하는 투명성
저자는 일부 국가가 공개 리포지토리에서 모든 시퀀스를 공유하지 않을 수 있는 몇 가지 이유를 제안합니다. Azman은 전체 게놈을 시퀀싱하지 않고 우려되는 변이체를 식별하는 방법이 있기 때문에 샘플 중 일부가 처음부터 시퀀싱되지 않았을 가능성이 있다고 말합니다. 그리고 연구자들이 사용한 시퀀싱 기술에 따라 일부 샘플은 업로드하기에 충분한 품질이 아닐 수 있다고 케손시티에 있는 필리핀 딜리만 대학의 분자생물학자인 신시아 살로마가 설명합니다.
그러나 공유되지 않은 시퀀스의 덩어리는 아마도 새로운 변형 우려를 보고한 첫 번째 국가가 되는 영향을 포함하여 정치적인 이유로 보류되고 있을 것입니다. 아부자에 있는 나이지리아 질병통제센터의 분자 생물공학자인 은나에메카 은도도(Nnaemeka Ndodo)는 "이러한 데이터를 공유하는 대부분의 국가는 일반적으로 이로 인해 고통을 겪는다"고 말했다. 예를 들어, 남아프리카 공화국과 보츠와나의 연구원들이 작년 11월에 Omicron 변종에 대해 세계에 경고했을 때 많은 국가 들이 이 지역에 대한 국경을 폐쇄함으로써 대응했습니다 .
일부 국가에서는 정부가 시퀀스를 업로드하기 전에 검토하고 승인해야 합니다. 관광에 의존하는 국가의 정부는 데이터가 미칠 영향 때문에 연구소에 데이터를 공유하지 않도록 요청할 수 있다고 Malavige는 말합니다.
그러나 Azman은 데이터 공유는 이야기의 일부일 뿐이라고 말합니다. 일부 국가는 샘플의 높은 비율을 공유하지만 소수의 게놈을 시퀀싱했다고 그는 말합니다.
연구원들은 87개국에서 일상적으로 샘플의 시퀀싱을 수행했지만 31개국은 그렇지 않았으며 팀은 다른 76개 국가에 대한 게놈 감시 전략에 대한 정보를 찾지 못했다는 사실을 발견했습니다. 전 세계적으로 확인된 COVID-19 사례의 4.5%만이 매주 시퀀싱되었습니다. 2020년 9월부터 연구 기간 동안 유럽에서 시퀀싱된 게놈의 총 3.4%에서 지중해 동부의 0.1%까지 지역에 따라 큰 불일치가 발생합니다. 노르웨이, 영국, 캐나다를 포함한 일부 국가에서는 누적 사례의 최소 10%를 시퀀싱했습니다.
데이터에 대한 데이터
이 연구는 또한 169개국이 GISAID에 업로드한 메타데이터의 품질을 평가했습니다. 염기서열의 63%에는 표본을 추출한 사람의 나이와 성별에 대한 정보가 포함되어 있지 않고 95% 이상에는 감염자의 증상 중증도 및 예방 접종 상태와 같은 임상 정보가 누락되어 있는 것으로 나타났습니다. 고소득 국가는 저소득 지역보다 더 적은 메타데이터를 제공하는 경향이 있습니다.
메타데이터는 새로운 변종이 나타날 때 누가 가장 위험한지, 기존 백신과 약물이 얼마나 잘 작동하는지, 그리고 그 출현으로 이어질 수 있었던 조건을 평가하는 데 특히 중요하다고 연구원들은 말합니다.
원천:
다시 말하지만, 데이터 개인 정보 보호 문제와 같은 정보 격차에 대한 여러 가지 이유가 있을 수 있으며 메타데이터 컬렉션이 시퀀싱되는 샘플의 속도를 따라갈 수 없습니다. 자카르타에 있는 코로나19 테스트 연구소 GSI 연구소를 이끌고 있는 생물공학자인 Nino Susanto는 때때로 샘플에 메타데이터가 누락되었을 수 있지만 외딴 지방에서 가져온 것이기 때문에 공유할 수 없다고 말합니다.
데이터 공유 문제에도 불구하고 이 연구는 또한 팬데믹 기간 동안 국가가 시퀀스를 공유하는 속도가 더 빨라졌다는 것을 발견했습니다. 2020년에는 대부분의 국가에서 연구자들이 게놈 데이터를 수집, 배열 및 공개 리포지토리에 업로드하는 데 평균적으로 거의 3개월이 걸렸습니다(속도 향상 참조). 그러나 델타 변종이 2021년에 등장할 때까지는 20일로 떨어졌습니다. "이 전염병은 공유를 정상화했습니다."라고 Azman은 말합니다.
도이: https://doi.org/10.1038/d41586-022-00894-x
참고문헌
Chen, Z. et al. 네이처 제넷 . https://doi.org/10.1038/s41588-022-01033-y (2022).
동부 고등 연구 연구소
중국 닝보
암 연구 영국 Beatson 연구소
영국 글래스고
키프로스 연구소
니코시아, 키프로스
SRM 대학
망갈라기리, 인도
|