리뷰어들과 논문의 공저자 중 한명은 "유전체 기업가인 크레이그 벤터의 논문이 '유전체 데이터에 대한 공공접근의 위험성'을 부풀리고 있다"며 성토하고 있다. @ Discover Magazine Blogs
유전체 시퀀싱의 개척자인 크레이크 벤터가 발표한 논문에서 "인간의 신체형질(physical trait)을 DNA로부터 예측할 수 있다"는 주장이 제기되자, 엄청난 비판이 쏟아지고 있다. 리뷰어들은 물론 심지어 논문의 공저자 한 명까지 가세하여, "인간의 유전자를 이용하여 개인을 식별하는 능력이 과장되는 바람에, 유전자 프라이버시에 대한 불필요한 공포감을 조성하고 있다"고 말한다. 지난 9월 5일 《Proceedings of the National Academy of Sciences(PNAS)》에 기고한 논문에서(참고 1), 벤터와 HLI(Human Longevity, Inc.)의 연구자들은 연령과 인종적 배경이 다양한 1,061명의 전유전체를 시퀀싱한 결과를 발표했다. 연구진은 참가자들의 유전자 데이터와 고품질 3D 사진을 이용하여, 인공지능 접근방법을 사용하여 'DNA의 작은 차이(SNP)'와 '안면특징(예: 광대뼈 높이)' 간의 상관관계를 찾아냈다. 또한 연구진은 신장, 체중, 연령, 음성, 피부색과 관련된 SNP까지도 찾아냈다. 이번 연구의 접근방법은 HLI의 데이터베이스에서 임의로 선정한 열 명의 사람들 중에서 74%의 정확도로 개인을 식별할 수 있는 것으로 나타났다. 논문에 따르면, 이 결과는 "사법기관, 과학자, 그 밖의 인간유전체 취급자들이 DNA 하나만으로 신원이 확인되는 상황을 막기 위해, 유전자 데이터베이스를 신중히 보호해야 한다"는 것을 시사 한다고 한다. HLI는 언론에 배포한 성명서에서, "HLI 연구자들의 핵심적인 신념은 '공공접근이 가능한 데이터베이스에서, 진정한 신분은폐와 완전한 프라이버시는 불가능하다'는 것이다"라고 말했다. 논란 많은 주장 그러나 논문을 검토해본 다른 유전학자들은 입을 모아 "연구진의 주장은 엄청나게 부풀려진 것으로 보인다"고 말한다. "나는 그 논문이 신원 및 프라이버시 노출의 위험을 제기하지 않는다고 생각한다. 왜냐하면 연구진은 특정인의 DNA를 이용하여 그에게 개성을 부여할 수 있음을 전혀 증명하지 못했기 때문이다"라고 펜실베이니아 주립대학교의 마크 슈라이버 박사(인류학)는 말했다(참고 2). "특히 HLI의 데이터베이스처럼 작고 다양한 데이터베이스에서 무작위로 선정된 열 명의 그룹에서는, 연령·성별·인종만 갖고서도 대부분의 개인들을 배제할 수 있을 것이다"라고 그는 말했다. 컬럼비아 대학교의 야니브 엘리히 박사(계산생물학)는 슈라이버 박사의 주장을 증명하기 위해, HLI의 논문에서 연령, 성별, 인종 데이터를 검토했다. 그리하여 9월 6일 출판전서버 《bioRxiv》에 업로드한 논문에서(참고 3), "HLI의 데이터베이스에서 선정된 열 명의 그룹에서 75%의 정확성으로 개인을 식별하는 데는 세 가지 형질만 갖고서도 충분하며, 더 이상의 유전체 정보를 알 필요도 없었다"고 보고했다. 나아가 그는 이렇게 말했다. "HLI가 재구성한 안면의 구조는 특이성이 그리 높지 않아, 성별과 인종이 같으면 그 사람이 그 사람 같아 구별하기 힘든 경우가 많다." "이번 논문은 《PNAS》에 실리기 전에 《Science》에 제출되었었다"고 《Science》에서 심사를 맡았던 슈라이버 박사는 공개했다. "HLI의 실제 데이터는 믿을 만하며, 연구진이 사용한 새로운 방법에 감탄했다. 예컨대 연구진은 (시간이 경과함에 따라 짧아지는) 염색체 말단을 시퀀싱함으로써 연령을 결정했다. 그러나 연구진은 DNA를 이용하여 개인의 신원을 확인할 수 있음을 증명하지 못했다. 나는 이번 논문이 연구의 내용과 결과를 완전히 왜곡하고 있다고 생각한다." 유전학자들의 비판에 대한 HLI의 반론은 다음과 같다. "이번 논문의 요점은 '천 개가 넘는 유전체를 이용한 연구결과에 근거하여, 복수의 파라미터(사람의 얼굴은 그중 하나일 뿐이다)를 이용하여 누군가의 신원을 확인하는 것이 가능하다'는 것이다." HLI의 대변인인 히더 코왈스키는 이렇게 말한다. "이번 논문은 예측의 정확성이 점점 더 증가하고 있음을 알렸다. 우리는 샘플의 수가 작았음을 인정하지만, 우리의 방법론을 고수할 것이다. 우리는 야니브 박사가 《bioRxiv》에 올린 비판에 반박할 준비를 하고 있다." 슈라이버 박사는 이번 논문의 내막을 공개했다. "나와 엘리히는 《Science》를 위해 논문을 검토한 후, 우리의 견해를 논문의 저자들에게 전달했다. 그리고 《Science》는 그 논문을 결국 기각했다." (《Science》는 출판되지 않은 연구에 대해 논평을 하지 않는다.) 그후 저자들은 《PNAS》에 논문을 제출했는데, 조건이 하나 있었다. 그것은 '미국 과학·공학·의학 아카데미의 회원 중 한 명(이를테면 벤터)에게 심사자 선정을 허용한다'는 것이었다. 그 결과 선정된 세 명의 심사자 중 두 명은 정보-프라이버시 전문가이고, 나머지 한 명은 생명윤리학자였다. 《PNAS》는 벤터가 심사자 세 명을 모두 선정했다고 인정했고, HLI는 PNAS의 논문심사 과정에 대해 논평을 거부했다. 프라이버시 이슈 이번 논문의 공저자로서 현재 애플 싱가포르 지사에서 일하고 있는 제이슨 파이퍼 박사(계산생물학)는 이번 논문이 연구결과를 잘못 전달하고 있음을 인정한다. "나는 HLI와의 계약에 따라, 원고가 저널에 제출되기 전에 원고에 대한 승인 권리를 포기했다. 따라서 HLI는 내 데이터를 자기들 입맛에 맞게 프리젠테이션하고 있다." 이에 대해 HLI는 "우리는 저자들에게 논문을 검토하고 논평할 기회를 줬다"라고 반박했다. 파이퍼는 그 이후 트위터를 통해 그 논문을 맹비난하며 이렇게 강조했다, "내 생각에는 HLI가 'DNA 데이터베이스의 접근 제한'에 대해 이해관계를 갖고 있는 것 같다. HLI는 비영리회사로서, 세계 최대의 인간유전자정보 데이터베이스를 구축하려고 시도하고 있다." "나는 유전자 프라이버시가 매우 중요하다고 생각하지만, HLI의 접근방법은 틀렸다"라고 파이퍼는 말했다. "유전체에서 좀 더 많은 정보를 얻으려면, 그것을 공유해야 한다. 좀 더 유용한 접근방법은 '개인의 신원을 밝히지 않고 유전체 데이터를 공개하는 방법(참고 4)을 강구하는 것이다." HLI는 전문가들의 비판에 대응하여 다음과 같은 성명서를 발표했다. "HLI는 '유전체 데이터 보호'와 '최신 데이터 교환 솔루션 촉진'이라는 원칙을 고수한다. 이번 논문은 '개인의 프라이버시를 보호하는 동시에 유전자 정보를 공유하는 방법'에 대한 논의를 촉진하기 위해 의도되었다." 그러나 엘리히는 아직도 이번 논문의 저의를 의심하고 있다. "정책 입안자들은 벤터의 지명도에 현혹되어 이번 논문에 과도한 비중을 부여하게 될 게 뻔하다. 새로운 규제와 법령은 그런 논문에 기초하여 탄생하기 마련이다. 그러나 프라이버시 위험을 다룰 때는, 먼저 팩트부터 바르게 이해하는 것이 중요하다"라고 그는 말했다.
※ 참고문헌 1. Lippert, C. et al., “Identification of individuals by trait prediction using whole-genome sequencing data”, Proc. Natl Acad. Sci. USA (2017); http://dx.doi.org/10.1073/pnas.1711125114 2. https://www.nature.com/news/mugshots-built-from-dna-data-1.14899 3. Erlich, Y., “Major flaws in ‘Identification of individuals by trait prediction using whole-genome sequencing data’”, Preprint on bioRxiv (2017); http://dx.doi.org/10.1101/185330 4. https://www.nature.com/news/spiking-genomic-databases-with-misinformation-could-protect-patient-privacy-1.20407
|