|
https://en.wikipedia.org/wiki/Genome
분자 생물학 및 유전학 분야에서 게놈 은 유기체의 모든 유전 정보입니다. [1] DNA (또는 RNA 바이러스 의 경우 RNA )의 뉴클레오티드 서열 로 구성됩니다 . 핵 게놈에는 단백질을 코딩하는 유전자와 비코딩 유전자, 조절 서열( 비코딩 DNA 참조)과 같은 게놈의 기타 기능적 영역, 그리고 종종 뚜렷한 기능이 없는 정크 DNA 의 상당 부분이 포함됩니다. [2] [3] 거의 모든 진핵생물은 미토콘드리아 와 작은 미토콘드리아 게놈을 가지고 있습니다 . [2] 조류와 식물에도 엽록체 게놈이 있는 엽록체가 포함되어 있습니다.
게놈에 관한 연구를 유전체학(genomics) 이라고 합니다 . 많은 유기체의 게놈이 서열화되었으며 다양한 영역에 주석이 달렸습니다. 인간 게놈 프로젝트는 1990년 10월에 시작되어 2003년 4월에 인간 게놈 의 서열이 보고되었지만 [4] 초기의 "완성된" 서열에는 대부분 반복 서열로 구성된 게놈의 8%가 누락되었습니다. [5]
인간 게놈 프로젝트(Human Genome Project) 연구에서 완전히 밝혀지지 않았던 인간 DNA에서 발견된 많은 반복 서열의 서열 분석을 처리할 수 있는 기술의 발전으로 과학자들은 2022년 3월 최초의 엔드투엔드 인간 게놈 서열을 보고했습니다. [6]
용어의 유래
게놈이라는 용어는 1920년 독일 함부르크 대학 의 식물학 교수 인 Hans Winkler 에 의해 만들어졌습니다 . 웹사이트 옥스포드 사전(Oxford Dictionaries) 과 온라인 어원 사전(Online Etymology Dictionary)에서는 이 이름이 유전자(gene )와 염색체(chromosome) 라는 단어의 혼합이라고 제안합니다 . [8] [9] [10] [11] 그러나 보다 자세한 논의는 omics를 참조하세요. biome 및 rhizome 과 같은 몇 가지 관련 -ome 단어가 이미 존재하여 게놈이 체계적으로 맞는 어휘를 형성합니다 . [12]
정의
"게놈"에 대한 정확한 정의를 내리는 것은 매우 어렵습니다. 이는 일반적으로 유기체에서 유전 정보를 전달하는 DNA(때로는 RNA) 분자를 의미하지만, 때로는 정의에 어떤 분자를 포함할지 결정하기 어렵습니다. 예를 들어, 박테리아는 일반적으로 모든 필수 유전 물질을 포함하는 하나 또는 두 개의 큰 DNA 분자( 염색체 )를 가지고 있지만, 중요한 유전 정보를 전달하는 더 작은 염색체외 플라스미드 분자도 포함합니다. 과학 문헌에서 일반적으로 사용되는 '게놈'의 정의는 일반적으로 박테리아의 큰 염색체 DNA 분자로 제한됩니다. [13]
진핵생물 게놈은 거의 모든 진핵생물 종들이 미토콘드리아 에 핵 염색체와 추가 DNA 분자를 포함하고 있기 때문에 정의하기가 훨씬 더 어렵습니다 . 또한 조류와 식물에는 엽록체 DNA가 있습니다. 대부분의 교과서에서는 핵 게놈과 소기관(미토콘드리아 및 엽록체) 게놈을 구별하므로, 인간 게놈에 대해 말할 때는 핵에 있는 유전 물질만 언급합니다. [2] [14] 이것은 과학 문헌에서 '게놈'이 가장 일반적으로 사용되는 표현입니다.
대부분의 진핵생물은 이배체 입니다 . 즉, 핵에는 각 염색체의 복사본이 두 개 있지만 '게놈'은 각 염색체의 복사본 하나만을 의미합니다. 일부 진핵생물은 포유류의 X 염색체와 Y 염색체와 같은 독특한 성염색체를 가지고 있으므로 게놈의 기술적 정의에는 성염색체의 두 복사본이 모두 포함되어야 합니다. 예를 들어 인간의 표준 참조 게놈을 참조할 때 이는 22개의 상염색체 각각의 사본 1개와 X 염색체 1개, Y 염색체 1개로 구성됩니다. [15]
시퀀싱 및 매핑 추가 정보: 게놈 프로젝트
게놈 서열은 개인이나 종의 모든 염색체를 구성하는 뉴클레오티드 (DNA 게놈의 경우 A, C, G 및 T) 의 전체 목록입니다 . 한 종 내에서 대다수의 뉴클레오티드는 개체 간에 동일하지만 유전적 다양성을 이해하려면 여러 개체의 염기서열을 분석하는 것이 필요합니다.
DNA 서열의 일부 – 바이러스 전체 게놈의 프로토타입화
1976년 벨기에 겐트대학교 의 월터 피어스(Walter Fiers )는 바이러스 RNA 게놈( 박테리오파지 MS2 ) 의 완전한 뉴클레오티드 서열을 최초로 확립했습니다 . 다음 해에 Fred Sanger는 5386개의 염기쌍으로 구성된 최초의 DNA 게놈 서열인 Phage Φ-X174 를 완성했습니다. [16] 서열 분석된 최초의 박테리아 게놈은 1995년 게놈 연구 연구소(The Institute for Genomic Research) 팀에 의해 완성된 헤모필루스 인플루엔자(Haemophilus pneumoniae)의 게놈이었습니다 . 몇 달 후 최초의 진핵생물 게놈이 완성되었으며, 이는 신진 효모의 16개 염색체 서열로 이루어졌습니다. Saccharomyces cerevisiae는 1980년대 중반에 시작된 유럽 주도의 노력의 결과로 출판되었습니다. 고세균인 Methanococcus jannaschii 의 첫 번째 게놈 서열은 1996년에 다시 유전체 연구 연구소 ( The Institute for Genomic Research)에 의해 완성되었습니다. [ 인용 필요 ]
새로운 기술의 발전으로 게놈 서열 분석이 훨씬 더 저렴하고 쉬워졌으며, 완전한 게놈 서열의 수가 빠르게 증가하고 있습니다. 미국 국립보건원(National Institutes of Health) 은 게놈 정보에 대한 여러 포괄적인 데이터베이스 중 하나를 유지 관리합니다. [17] 수천 개의 완성된 게놈 서열 분석 프로젝트 중에는 쌀 , 생쥐 , 애기 장대 식물 , 복어 및 박테리아 대장균 에 대한 프로젝트가 포함됩니다 . 2013년 12월, 과학자들은 처음으로 멸종된 인류 종인 네안데르탈 인의 전체 게놈 서열을 분석했습니다 . 게놈은 시베리아 동굴 에서 발견된 13만년 전 네안데르탈인의 발가락뼈 에서 추출되었습니다 . [18] [19]
대규모 병렬 시퀀싱 과 같은 새로운 시퀀싱 기술 도 Manteia Predictive Medicine 이 개척한 진단 도구로서 개인 게놈 시퀀싱의 가능성을 열었습니다 . 그 목표를 향한 주요 단계는 DNA 구조의 공동 발견자 중 한 명인 제임스 D. 왓슨(James D. Watson) 의 전체 게놈이 2007년에 완성된 것입니다. [20]
게놈 서열은 게놈의 모든 DNA 염기의 순서를 나열하는 반면, 게놈 지도는 랜드마크를 식별합니다. 게놈 지도는 게놈 서열보다 덜 상세하며 게놈 주변을 탐색하는 데 도움이 됩니다. 인간 게놈 프로젝트(Human Genome Project)는 인간 게놈의 지도를 작성 하고 서열을 매기기 위해 조직되었습니다 . 이 프로젝트의 근본적인 단계는 Jean Weissenbach 와 그의 팀이 파리 Genscope 에서 상세한 게놈 지도를 공개한 것이었습니다. [21] [22]
참조 게놈 서열과 지도는 계속 업데이트되어 오류를 제거하고 대립유전자 복잡성이 높은 영역을 명확히 합니다. [23] 게놈 매핑 비용이 감소함에 따라 계보 사이트에서는 이를 서비스로 제공할 수 있게 되었으며, [24] 뉴욕 게놈 센터 의 DNA.LAND 와 같은 크라우드소싱 과학적 노력 에 자신의 게놈을 제출할 수 있게 되었습니다 . [25 ] 규모의 경제 와 시민 과학 의 예입니다 . [26]
바이러스 게놈
바이러스 게놈은 RNA 또는 DNA로 구성될 수 있습니다. RNA 바이러스 의 게놈은 단일 가닥 RNA 이거나 이중 가닥 RNA 일 수 있으며 하나 이상의 별도 RNA 분자(분절: 단일 부분 또는 다중 부분 게놈)를 포함할 수 있습니다. DNA 바이러스는 단일 가닥 또는 이중 가닥 게놈을 가질 수 있습니다. 대부분의 DNA 바이러스 게놈은 단일 선형 DNA 분자로 구성되지만 일부는 원형 DNA 분자로 구성됩니다. [27]
원핵생물 게놈
원핵생물과 진핵생물은 DNA 게놈을 가지고 있습니다. Archaea와 대부분의 박테리아는 단일 원형 염색체를 가지고 있지만 [28] 일부 박테리아 종은 선형 또는 다중 염색체를 가지고 있습니다. [29] [30] 박테리아의 세포 분열보다 DNA의 복제 속도가 빠르면 단일 세포 내에 염색체가 여러 개 존재할 수 있고, DNA의 복제 속도보다 세포의 분열 속도가 빠르면 염색체의 다중 복제가 가능하다. 분열이 일어나기 전에 시작되어 딸세포가 완전한 게놈과 이미 부분적으로 복제된 염색체를 물려받게 됩니다. 대부분의 원핵생물은 게놈에 반복적인 DNA가 거의 없습니다. [31] 그러나 일부 공생 박테리아 (예: Serratia Symbiotica )는 게놈이 감소하고 유사 유전자의 비율이 높습니다. DNA의 ~40%만이 단백질을 암호화합니다. [32] [33]
일부 박테리아는 플라스미드 에 운반되는 게놈의 일부인 보조 유전 물질을 가지고 있습니다 . 이를 위해 게놈(genome) 이라는 단어를 염색체(chromosome) 의 동의어로 사용해서는 안 된다 .
진핵생물 게놈 [ 편집 ]
참조: 진핵생물의 염색체 미세 구조
일반적인 인간 세포에서 게놈은 22쌍의 상염색체 , 2개의 성염색체 (오른쪽 아래에 표시된 여성 및 남성 변종), 그리고 미토콘드리아 게놈 (왼쪽 아래에 "MT"로 표시됨)에 포함되어 있습니다.
추가 정보: 핵형
진핵생물 게놈은 하나 이상의 선형 DNA 염색체로 구성됩니다. 염색체의 수는 점퍼개미 와 무성 선충 ( 각각 한 쌍만 있음 ) 부터 720쌍을 가진 양치류 종 까지 매우 다양합니다. [35] 진핵생물 게놈이 다른 게놈에 비해 포함하고 있는 DNA의 양은 놀랍습니다. 진핵생물 게놈의 크기가 최대 64,000배나 다양하기 때문에 그 양은 DNA 단백질을 코딩하는 유전자와 비코딩 유전자에 필요한 양보다 훨씬 더 많습니다. 그러나 이러한 특별한 특징은 반복적인 DNA와 전이 요소(TE)의 존재로 인해 발생합니다.
일반적인 인간 세포는 22개의 상염색체 각각의 사본 2 개(각 부모로부터 하나씩 물려받음)와 2개의 성염색체를 갖고 있어 이배체가 됩니다. 난자, 정자, 포자, 꽃가루와 같은 생식세포는 반수체입니다. 즉, 각 염색체의 사본 하나만을 가지고 있습니다. 핵의 염색체 외에도 엽록체 , 미토콘드리아 와 같은 세포 소기관 에는 자체 DNA가 있습니다. 미토콘드리아는 종종 " 미토콘드리아 게놈 "으로 불리는 자신만의 게놈을 갖고 있다고 알려져 있습니다. 엽록체 내에서 발견되는 DNA는 " 플라스트톰(plastome) "으로 지칭될 수 있습니다. 미토콘드리아와 엽록체는 그들이 유래한 박테리아와 마찬가지로 원형 염색체를 가지고 있습니다.
단백질 코딩 유전자의 엑손-인트론 조직이 존재하지만 다소 예외적인 원핵생물과 달리, 진핵생물은 일반적으로 유전자에 이러한 특징을 갖고 있으며 게놈에는 다양한 양의 반복 DNA가 포함되어 있습니다. 포유류와 식물에서 게놈의 대부분은 반복적인 DNA로 구성됩니다. 진핵 생물 게놈의 유전자는 FINDER를 사용하여 주석을 달 수 있습니다. [38] [39]
DNA 서열 분석 [ 편집 ]
높은 처리량 기술을 통해 시퀀싱을 통해 모든 사람이 접근할 수 있는 새로운 게놈을 조립할 수 있습니다. 서열 다형성은 일반적으로 재배열된 분리주를 참조와 비교하여 발견되는 반면, 적용 범위 깊이 및 매핑 토폴로지 분석은 염색체 전좌 및 분절 중복과 같은 구조적 변이에 관한 세부 정보를 제공할 수 있습니다.
코딩 순서 [ 편집 ]
단백질을 만드는 명령을 전달하는 DNA 서열을 코딩 서열이라고 합니다. 코딩 서열이 차지하는 게놈의 비율은 매우 다양합니다. 더 큰 게놈이 반드시 더 많은 유전자를 포함하는 것은 아니며, 복잡한 진핵생물에서 게놈 크기가 증가함에 따라 비반복적 DNA의 비율이 감소합니다. [37]
인간 게놈의 구성비코딩 시퀀스 [ 편집 ]
이 부분의 본문은 비암호화 DNA 입니다.
참조: 유전자간 영역
비암호화 서열에는 인트론 , 비암호화 RNA 서열, 조절 영역 및 반복 DNA가 포함됩니다. 비암호화 서열은 인간 게놈의 98%를 구성합니다. 게놈에는 두 가지 범주의 반복 DNA가 있습니다: 직렬 반복 과 산재 반복. [40]
탠덤 반복 [ 편집 ]
머리에서 꼬리까지 반복되는 짧은 비암호화 시퀀스를 직렬 반복 이라고 합니다 . 미세위성체는 2~5개의 염기쌍 반복으로 구성된 반면, 소형위성 반복체는 30~35bp입니다. 직렬 반복은 인간 게놈의 약 4%, 초파리 게놈의 9%를 구성합니다. 직렬 반복은 기능적일 수 있습니다. 예를 들어, 텔로미어는 포유동물의 TTAGGG 반복 반복으로 구