|
|
PMCID: PMC7413016 PMID: 32770171
Thirty years on from the launch of the Human Genome Project, Richard Gibbs reflects on the promises that this voyage of discovery bore. Its success should be measured by how this project transformed the rules of research, the way of practising biological discovery and the ubiquitous digitization of biological science.
인간 게놈 프로젝트의 시작으로부터 30년이 지난 지금,
리처드 기브스는 이 탐구의 여정이 안고 있던 약속들에 대해 반추합니다.
이 프로젝트의 성공은
연구의 규칙, 생물학적 발견의 실천 방식, 생물학의 보편적인 디지털화 측면에서
어떻게 변화를 가져왔는지로 평가되어야 합니다.
Subject terms: Biotechnology, Genetic techniques, DNA sequencing, Genomics
The author
Richard Gibbs, AC, PhD is a human geneticist and the Founding Director of the Baylor College of Medicine Human Genome Sequencing Center (HGSC). He graduated from the University of Melbourne in Genetics and Radiation Biology and moved to Houston, TX, to study the molecular basis of genetic disease. He developed basic methods for DNA and mutation analysis and was an early contributor to the Human Genome Project (HGP), leading one of five sites that generated the majority of the sequence. Since the completion of the HGP, he has led multiple genome projects including the generation of the first personalized whole-genome diploid human sequences. His group pioneered the oligonucleotide exon-capture methods that are widely used today for whole-exome sequencing, and he is currently leading programmes for translation of genomic data into the clinic.
리처드 기브스, AC, PhD는 인간 유전학자이자 베일러 의과대학 인간 게놈 시퀀싱 센터(HGSC)의 창립 소장입니다. 그는 멜버른 대학교에서 유전학과 방사선 생물학을 전공한 후 텍사스 주 휴스턴으로 이동해 유전적 질환의 분자적 기전을 연구했습니다. 그는 DNA 및 돌연변이 분석의 기본 방법을 개발했으며 인간 게놈 프로젝트(HGP)의 초기 기여자로, 전체 시퀀스의 대부분을 생성한 5개 사이트 중 하나를 이끌었습니다. HGP 완료 이후 그는 첫 번째 개인 맞춤형 전체 게놈 이배체 인간 시퀀싱을 포함한 다수의 게놈 프로젝트를 주도했습니다. 그의 연구팀은 현재 널리 사용되는 전체 엑솜 시퀀싱을 위한 올리고뉴클레오티드 엑손 캡처 방법을 개척했으며, 현재 게놈 데이터를 임상 현장으로 전환하는 프로그램을 이끌고 있습니다.
The joint announcement of the release of the human ‘draft’ genome sequences occurred 20 years ago, at a ceremony in the White House. The first analyses by two groups, the publicly funded International Human Genome Project (HGP) Consortium and Celera Genomics, were published in Nature1 and Science2, respectively, shortly after. While the analyses were superficial by contemporary standards, this was nevertheless a milestone that provided exciting first glimpses into the entire human genome. The announcement was hailed as ‘the end of the beginning’ and a launch pad for a new era. After two decades, have the aspirational aims of the HGP been realized? Without doubt, the answer is yes; it is simply inconceivable today that we would not have the genome at our fingertips — as unimaginable, perhaps, as not having computers or the internet.
it is simply inconceivable today that we would not have the genome at our fingertips
Critics cite a failure to meet the most outlandish visions as evidence that the HGP has not lived up to all promises. The project was initially conceived with fairly sober predictions, including the benefits of a complete cancer genome, advances in genetics and the development of improved technologies3. It was not until closer to the programme launch in 1990 and at milestones along the way that the rhetoric was loudly elevated to claims of revolutionizing biology, biotechnology, drug development and even society. A favourite prediction was the personalization of therapies and the liberation of drugs that otherwise were unusable, through identification of the few individuals with adverse responses. The mysteries of the architecture of common complex diseases were to be revealed and even behavioural traits might be solved. The predictions included the possibility to breed ‘super babies’ based on this new knowledge and, at the same time, perhaps even predict criminality4. In hindsight, there was plenty of hype that was shared with the media and the wider community. Critics are correct that the apex of these claims was not reached. The hyperbole that we look back on did not, however, come from the front line. It came from those who championed the programme, mindful of its long-term benefits. Thanks to them, they generated the enthusiasm to fund this transformative work.
Among those immersed in the delivery of the primary aims of the project, the mood was more measured. ‘Basic’ biologists wanted their favourite model organisms characterized so that human gene homologues could be identified. Clinical geneticists were fixated on discovery and genetic dissection of the molecular basis of inherited childhood disorders, while adult disease specialists sought answers to why some suffered common maladies, such as cardiovascular disease or cancer. Technologists recognized that this was the gateway to the new era of high-throughput, digital biology.
There were still lofty goals, and major contributors who were convinced of the imperative of completing the project shared core beliefs of the broad impact of a completed human sequence. All recognized that, for the first time, these studies would share a characteristic comprehensiveness that was an uncommon luxury in biology. For the first time, there would be knowledge on all genes, all diseases and all genetic variants. Participants recognized the power of broad data sharing and the legacy of the Bermuda Principles for future biology5. The organizational rigor required to manage the HGP was new for biology, and it was apparent that future programmes would benefit from HGP lessons in logistics. These ambitions were the backdrop for the knowledge of how difficult the task would be, without advanced computers, automated sequencing or any roadmap from a similar effort.
인간 '초안' 유전체 시퀀스 공개 발표는 20년 전 백악관에서 열린 행사에서 이루어졌습니다. 공공 자금으로 지원된 국제 인간 유전체 프로젝트(HGP) 컨소시엄과 셀레라 제노믹스(Celera Genomics)의 두 연구팀이 진행한 첫 분석 결과는 각각 Nature1과 Science2에 게재되었습니다. 당시 기준으로는 분석이 표면적이었지만, 이는 인간 유전체 전체에 대한 첫 번째 흥미로운 힌트를 제공한 중요한 이정표였습니다. 이 발표는 '시작의 끝'으로 칭송되며 새로운 시대의 출발점이 되었습니다.
20년이 지난 지금,
HGP의 야심찬 목표는 실현되었을까요?
의심할 여지 없이 답은
'예'입니다.
오늘날 인간 유전체를 손끝에 두고 있지 않다는 것은
상상하기 어렵습니다.
이는 아마도 컴퓨터나 인터넷이 없는 세상과 마찬가지로
상상하기 어려운 일일 것입니다.
오늘날 인간 유전체를 손끝에 두고 있지 않다는 것은 상상하기 어렵습니다
비평가들은 가장 과감한 비전을 달성하지 못한 것을 근거로
HGP가 모든 약속을 지키지 못했다고 지적합니다.
이 프로젝트는 처음에는 비교적 현실적인 예측으로 시작되었으며,
완전한 암 유전체 데이터의 혜택, 유전학의 발전, 개선된 기술의 개발 등을 포함했습니다.
1990년 프로그램 시작 직전과 주요 단계에서야 비로소
생물학, 생물기술, 약물 개발, 심지어 사회까지 혁명적으로 변화시킬 것이라는 주장이
강하게 제기되기 시작했습니다.
인기 있는 예측 중 하나는 치료법의 개인화였으며,
부작용을 보이는 소수의 개인을 식별함으로써
otherwise 사용 불가능한 약물을 해방시킬 수 있다는 것이었습니다.
일반적인 복잡한 질병의 구조적 비밀이 밝혀지고
심지어 행동 특성까지 해결될 수 있을 것이라는
전망도 있었습니다.
예측에는 이 새로운 지식을 바탕으로
'슈퍼 베이비'를 육성하는 가능성과 동시에
범죄성을 예측할 수 있다는 주장까지 포함되었습니다4.
회고해 보면,
미디어와 일반 대중과 공유된 과대광고가 많았습니다.
비판자들은
이러한 주장의 정점이 달성되지 않았다는 점을 옳게 지적했습니다.
그러나
우리가 회상하는 과대광고는
현장 최전선에서 나온 것이 아닙니다.
이는 프로그램의 장기적 혜택을 염두에 둔 지지자들로부터 나왔습니다.
그들의 노력으로 이 변혁적인 연구를 지원하기 위한 열정이 생성되었습니다.
프로젝트의 주요 목표 달성에 몰두한 연구자들 사이에서는
분위기가 더 신중했습니다.
'기본' 생물학자들은 인간 유전자 동족체를 식별하기 위해 선호하는 모델 생물체를 특성화하는 것을 원했습니다. 임상 유전학자들은 유전성 소아 질환의 분자적 기전을 발견하고 분석하는 데 집중했으며, 성인 질환 전문가들은 심혈관 질환이나 암과 같은 일반적인 질환을 앓는 사람들이 왜 그런 질환을 앓는지 답을 찾고자 했습니다. 기술자들은 이것이 고효율 디지털 생물학의 새로운 시대를 여는 관문임을 인식했습니다.
여전히 높은 목표가 있었고,
프로젝트 완수의 필요성을 확신한 주요 기여자들은
완성된 인간 유전체 서열의 광범위한 영향력에 대한
핵심 신념을 공유했습니다.
모든 참여자는
이 연구들이 생물학에서 드문 특권인 포괄성을 처음으로 공유할 것이라는 점을 인식했습니다.
처음으로
모든 유전자, 모든 질환, 모든 유전적 변이에 대한 지식이 확보될 것입니다.
참여자들은
광범위한 데이터 공유의 힘과 버뮤다 원칙이
미래 생물학에 남길 유산에 대해 인식했습니다.
HGP를 관리하기 위해 필요한 조직적 엄격함은 생물학에 새로운 것이었으며,
미래 프로그램이 HGP의 물류 관리 교훈을 활용할 수 있을 것이 분명했습니다.
이러한 야심찬 목표는
고급 컴퓨터, 자동화된 시퀀싱 기술, 유사한 노력으로부터의 로드맵 없이
이 과제가 얼마나 어려운지 인식하는 배경이 되었습니다.
A 25-plus-year timetable
There was also a realistic insiders’ view of likely post-HGP rates of progress and how difficult biological discovery can be, in the best of circumstances. The HGP was foundational and the project would lead to new ways to do things, but not all thought progress would be easy. The HGP took just 13 years, as after the 2000 announcement we all worked an extra 3 years to finish the ‘essentially complete genome’, and it is interesting to compare that period to other transitional milestones in biology. In 1987, the groups of Francis Collins and Lap-Chee Tsui discovered the gene that contains the variants that underlie cystic fibrosis6. That discovery (pre-HGP) was appropriately hailed as the first step towards a cure. In 2012, the first resulting drug to treat a subset of patients with cystic fibrosis was approved by the FDA. For Huntington disease, a similar time span was needed to go from gene discovery to a new treatment that is only now being tested7. The familial breast cancer gene is another example of the time between discovery and action; linkage to BRCA1 was identified in the 1990s with initial hopes that isolating the gene underlying the 1% of cases that were familial would give insights into the vast majority of sufferers with sporadic disease. That connection was not obvious, and the complicated relationship between this gene, its germline and somatic variants, related genes and interacting proteins, and the consequences for cancer are still being unraveled8. A 25–30-year period between discovery and impact on health care is more the rule than the exception.
25년 이상의 시간표
또한 HGP 이후의 진전 속도와 최상의 조건에서도 생물학적 발견이 얼마나 어려운지에 대한 현실적인 내부자의 관점이 있었습니다. HGP는 기초적인 프로젝트였으며 새로운 방법을 이끌어낼 것이었지만, 모든 진전이 쉽다고 생각하지는 않았습니다.
HGP는
13년 만에 완료되었는데,
2000년 발표 후 모두 3년을 추가로 노력해 '본질적으로 완성된 유전체'를 완성했기 때문입니다.
이 기간을 생물학의 다른 전환점과 비교하는 것은 흥미로운 일입니다.
1987년,
프랜시스 콜린스와 랩-치 추이 연구진은
낭포성 섬유증의 원인이 되는 변이 유전자를 발견했습니다6.
이 발견(HGP 이전)은 치료를 향한 첫 걸음으로 적절히 평가받았습니다. 2
012년, 낭포성 섬유증 환자의 일부를 치료하는 첫 번째 약물이 FDA 승인을 받았습니다.
헌팅턴 병의 경우,
유전자 발견에서 새로운 치료법 개발까지 유사한 시간이 소요되었으며,
이 치료법은 현재 시험 단계에 있습니다7.
가족성 유방암 유전자는
발견에서 행동으로의 시간 간격의 또 다른 예시입니다.
BRCA1과의 연관성이 1990년대 초에 확인되었으며, 가족성 사례의 1%를 차지하는 유전자를 분리하면 산발성 질환을 앓는 대부분의 환자에 대한 통찰을 얻을 수 있을 것이라는 초기 기대가 있었습니다. 이 연관성은 명확하지 않았으며, 이 유전자, 그 유전적 및 체세포 변이체, 관련 유전자 및 상호작용 단백질, 그리고 암에 미치는 영향 간의 복잡한 관계는 여전히 규명 중입니다8.
발견부터 의료에 미치는 영향까지 25~30년의 기간은
예외가 아닌 일반적인 사례입니다.
Parallel transformations
HGP participants trusted their own power to innovate but also hoped for other developments to leverage the programme. While the project unfolded, a revolution occurred in computation. In the late 1980s, the only computers in the laboratories of genomicists were the earliest PCs and Apple products. By 2000, we had all been connected by the internet, bandwidth was adequate to move the genome data, and adequate processing power was accessible. A strength of the HGP and its participants was that these parallel developments were rapidly incorporated into the framework of biology. Necessity speeds invention — and the need to manage copious amounts of digital genome data was the real driver of the growth of computational biology, ahead of the demands of physiologists or structural biologists. Most importantly, a generation of bioinformatics experts and computational biologists emerged who brought the genome data to the widest audiences.
The power of advances in genomics and computers was revealed in the spectacular series of post-HGP projects that were of comparable scale. After multiple mammalian genome projects, programmes including the Haplotype Mapping (HapMap) Project9, the 1000 Genomes Project10 and The Cancer Genome Atlas (TCGA) progressively illustrated the advancement of knowledge by more sophisticated data sharing, comparison and analysis. As these and other projects unfolded, new constituencies were engaged and more scientists and clinicians became ‘digital’ and ‘genomic’. The projects were emblematic of the advancement of scaling, digitization and sharing that was sparked by the HGP.
Some still tally the success of the HGP from lists of new drugs or therapies and argue that world-changing examples in biology, such as the spectacular advances of gene editing tools or the expansion of cancer therapeutics through targeted immunotherapy, are largely based on microbial, cellular and animal studies rather than genomics. This argument misses the point. These are among the myriad of discoveries that occurred in the backdrop of a new era. New ideas and primary discovery may still be the ‘quiet conversation with nature’ of the experimental biologist — but validation, contextualization, deployment and translation are all streamlined by the fruits of the HGP.
validation, contextualization, deployment and translation are all streamlined by the fruits of the HGP
It is a vastly different world today in 2020, compared with 1990. Human genome sequences cost less than US$1,000 per genome, all trainees in experimental biology and genetics are pressed to be proficient in computer languages, and easy access to mountains of primary and derived data has come to be expected. As the recent coronavirus pandemic emerged, thousands of trainees, forced to remain out of the wet-lab, pivoted to computational studies; 30 years ago they would have been lost. The real fruits of the HGP lie in the contrast between the primitive state of digital biology in the late 1980s and the current ease with which all scholars can access, harness and analyse biological data.
병행된 변혁
HGP 참여자들은 자신의 혁신 능력을 믿었지만, 프로그램의 성과를 활용하기 위해 다른 발전도 기대했습니다. 프로젝트가 진행되는 동안 계산 분야에서도 혁명이 일어났습니다. 1980년대 후반, 유전체학자들의 실험실에는 초기 PC와 애플 제품만이 있었습니다. 2000년까지 우리는 인터넷으로 연결되었고, 유전체 데이터를 전송할 수 있는 대역폭이 확보되었으며, 충분한 처리 능력이 доступ해졌습니다. HGP와 그 참여자들의 강점은 이러한 병행 발전이 생물학의 틀에 신속히 통합되었다는 점입니다. 필요성은 발명을 촉진합니다 — 그리고 방대한 디지털 유전체 데이터를 관리해야 하는 필요성이 생물정보학의 성장을 주도했으며, 이는 생리학자나 구조 생물학자의 요구보다 앞서 있었습니다. 가장 중요한 것은 유전체 데이터를 가장 넓은 대중에게 전달한 생물정보학 전문가와 계산 생물학자의 세대가 등장했다는 점입니다.
게놈학과 컴퓨터 기술의 발전은 HGP 이후 진행된 대규모 프로젝트 시리즈에서 그 힘을 입증했습니다. 포유류 게놈 프로젝트 이후, Haplotype Mapping (HapMap) 프로젝트9, 1000 Genomes Project10 및 The Cancer Genome Atlas (TCGA)는 더 정교한 데이터 공유, 비교 및 분석을 통해 지식의 진보를 단계적으로 보여주었습니다. 이러한 프로젝트들이 진행되면서 새로운 이해관계자들이 참여했으며, 더 많은 과학자와 임상 의사들이 '디지털'과 '유전체'로 전환되었습니다. 이 프로젝트들은 HGP가 촉발한 확장, 디지털화, 공유의 진보를 상징했습니다.
일부 연구자들은 HGP의 성공을 새로운 약물이나 치료법 목록으로 평가하며, 유전자 편집 도구들의 놀라운 발전이나 표적 면역요법을 통한 암 치료법의 확장 같은 생물학 분야의 세계적 변화 사례가 주로 미생물, 세포 및 동물 연구에 기반을 두고 있으며 유전체학과는 무관하다고 주장합니다. 이 주장은 핵심을 놓치고 있습니다. 이러한 발견들은 새로운 시대의 배경에서 이루어진 수많은 발견 중 일부에 불과합니다. 새로운 아이디어와 원천적 발견은 여전히 실험 생물학자의 '자연과의 조용한 대화'일 수 있지만, 검증, 맥락화, 적용, 번역은 모두 HGP의 성과로 인해 효율화되었습니다.
검증, 맥락화, 적용, 번역은 모두 HGP의 성과로 인해 효율화되었습니다.
2020년 현재는 1990년과 비교할 수 없을 정도로 다른 세상입니다. 인간 유전체 시퀀싱 비용은 유전체당 US$1,000 미만으로 떨어졌으며, 실험 생물학 및 유전학 분야의 모든 연구자들은 컴퓨터 언어에 능숙해야 하며, 원시 데이터와 파생 데이터의 방대한 양에 쉽게 접근할 수 있는 것이 당연시되고 있습니다. 최근 코로나19 팬데믹이 발생하자, 실험실 밖에서 머물러야 했던 수천 명의 연구자들은 계산 연구로 전환했습니다. 30년 전이라면 그들은 길을 잃었을 것입니다. HGP의 진정한 성과는 1980년대 후반 디지털 생물학의 원시적인 상태와 현재 모든 연구자가 생물학적 데이터를 접근, 활용, 분석하는 것이 얼마나 쉬워졌는지의 대비에 있습니다.
Acknowledgements
R.A.G. is partially supported by grants from the National Human Genome Research Institute.
Competing interests
The author declares no competing interests.
References
|
|