|
저자 표시
자연 용량 612 , 페이지283–291 ( 2022 ) 이 기사 인용
664 알트메트릭
추상적인
후기 Pliocene과 초기 Pleistocene 시대 360만~80만년 전 1 은 미래 온난화에서 예측된 기후와 유사 했습니다 2 . 고기후 기록은 연평균 기온이 당대의 값보다 11–19 °C 높은 강한 극지 증폭을 보여줍니다 3 , 4 . 화석이 드물기 때문에 이 기간 동안 북극에 거주하는 생물학적 군집은 잘 알려져 있지 않습니다 5 . 여기서 우리는 고대 환경 DNA를 보고합니다 6약 200만년 전으로 거슬러 올라가는 북그린란드의 Kap København Formation의 풍부한 동식물 군집을 설명하는 (eDNA) 기록. 이 기록은 포플러, 자작나무, thuja 나무의 혼합 식생뿐만 아니라 다양한 북극 및 아한대 관목과 허브가 있는 탁 트인 아한대 삼림 생태계를 보여줍니다. DNA 기록은 마스토돈, 순록, 설치류 및 거위를 포함한 동물의 토끼 및 미토콘드리아 DNA의 존재를 확인하며, 모두 현재 및 후기 홍적세 친척의 조상입니다. 투구게와 녹조류를 포함한 해양 종의 존재는 오늘날보다 더 따뜻한 기후를 지원합니다. 재구성된 생태계에는 현대적 아날로그가 없습니다. 그러한 고대 eDNA의 생존은 아마도 광물 표면에 대한 결합과 관련이 있을 것입니다.
기본
Kap København Formation은 현재 극지 사막인 North Greenland(82° 24′ N 22° 12′ W)의 Peary Land에 있습니다. 상부 퇴적 순서에는 더 따뜻해진 초기 홍적세 간빙기 주기 7 (그림 1 ) 동안 강어귀로 씻겨 내려간 잘 보존된 육상 동물과 식물 잔해가 포함되어 있습니다. 거의 40년 동안 현장에서 진행된 고생물 환경 및 기후 연구는 현장이 재건된 여름 및 겨울 평균 최저 기온이 각각 10°C 및 -17°C(10°C 이상)인 아한대 북극 에코톤에 위치했던 기간에 대한 독특한 관점을 제공합니다. °C 현재보다 따뜻함 7 , 8 , 9 , 10 , 11. 이러한 조건으로 인해 그린란드 빙상이 상당히 삭감되어 지난 240만 년(Myr) 동안 마지막 얼음이 없는 기간 중 하나가 생성되었을 수 있습니다 . Kap København Formation은 침엽수림과 풍부한 곤충 동물군에서 잘 보존된 대형 화석을 산출하는 것으로 알려져 있지만, 척추동물의 흔적은 거의 발견되지 않았습니다. 현재까지, 이들은 포유류 배설물 10 , 11 에서 서식 하는 lagomorph 속, 그들의 coprolites 및 Aphodius 딱정벌레로 구성 됩니다. 그러나 북극 캐나다의 Ellesmere 섬에 있는 약 3.4 Myr 오래된 Fyles 잎 침대와 Beaver Pond는 멸종된 곰( Protarctos abstrusus), 멸종된 비버( Dipoides sp.), 작은 송곳니 Eucyon 및 북극 거대 낙타류 4 , 12 , 13 ( Paracamelus 와 유사 ). 나레스 해협이 그린란드 북부를 이 동물군에 의한 식민지화로부터 고립시키는 데 충분한 장벽이었는지 여부는 여전히 열려 있는 질문입니다.
그림 1: 지리적 위치 및 퇴적 순서.
. _ 인디펜던스 피요르드(82° 24′ N 22° 12′ W) 입구에 있는 그린란드 북부에 있는 Kap København Formation의 위치와 다른 북극 Plio-Pleistocene 화석 보유 지역(빨간색 점)의 위치. b , Mudderbugt와 북쪽을 향한 낮은 산 사이의 얕은 해양 근해 퇴적물의 100m 두께 연속 침식 잔해의 공간 분포 (a + b는 위치 74a 및 74b를 나타냄). c , 모래 멤버 B를 구성하는 점토 멤버 A 및 단위 B1, B2 및 B3의 퇴적 연속의 빙하-간빙기 구분. 모든 사이트의 샘플링 간격은 지역 50의 퇴적 연속에 투영됩니다. ref. 7. 지도의 동그라미 숫자는 환경 DNA 분석, 절대 매장 연대 측정 및 고생물학을 위한 샘플 사이트를 표시합니다. 번호가 매겨진 사이트는 이전 간행물 7 , 10 , 11 , 14 , 61 을 참조하십시오 .
Kap København Formation은 공식적으로 두 개의 구성원 ( 7 )으로 세분됩니다 (그림 1 ). 하부 멤버 A는 해양 빙하 환경 14 에 퇴적된 북극 도골류, 유공충 및 연체동물 동물군이 있는 최대 50m의 적층 진흙으로 구성됩니다 . 위의 구성원 B는 40-50m의 모래(단위 B1 및 B3) 및 미사질(단위 B2) 퇴적물로 구성되어 있습니다(확장 데이터 그림 1 ) . 상부 및 하부 해안면 퇴적상으로 대표되는 얕은 해양 또는 강어귀 환경의 해안 7 .
특정 퇴적 환경은 근위 B3 지역이 가장 낮은 점토와 가장 높은 석영 함량을 갖는 단위의 광물학에도 반영됩니다 (보충 표 4.2.1 및 4.2.2 의 샘플 조성과 보충 표 4.2.3 의 단위 평균 및 4.2.4 ). 유역 채우기의 구조는 Member B 단위가 현재 해안을 향해 두꺼워진다는 것을 암시 합니다 . B1과 B3 단위에는 풍부한 유기물 잔해층이 기록되어 있으며, 여기에는 북극과 아한대 식물, 무척추동물 거대화석, 육상 이끼가 풍부한 층도 포함되어 있습니다 10 , 15. 따라서 DNA의 타포노미는 다양한 서식지에서 침식된 생물학적 군집을 반영할 가능성이 높으며 해안으로 하천으로 운반되고 유닛 B1 및 B3 내의 모래 근해 퇴적물에 혼합된 유기물 쓰레기로 농축됩니다. 반대로, 멤버 A와 유닛 B2의 심해는 해양 신호가 더 강합니다. 이 시나리오는 Kap København Formation 퇴적물과 Kim Fjelde 퇴적물 사이의 광물학적 구성의 유사성에 의해 뒷받침됩니다(보충 표 4.2.1 및 4.2.5 ).
지질학적 시대
일련의 보완 연구는 Kap København Formation의 퇴적 연대를 4.0–0.7 Myr에서 2.4 Myr 주변의 20,000년 연대로 연속적으로 좁혔습니다(보충 정보, 섹션 1 – 3 참조). 이것은 고자기학, 생물층서학 및 동층서학의 조합에 의해 달성되었습니다 7 , 14 , 16 , 17 , 18 . 특히, 층서학적 기록에서 포유류, 유공충 및 연체동물의 마지막 출현 데이터는 2.4 Myr에 가까운 연령을 보여줍니다(보충 정보, 섹션 2 참조).). 이 전체 프레임워크 내에서 구성원 A가 역방향 자기 극성을 가지고 있고 위에 있는 단위 B2의 주요 부분이 정상적인 자기 극성을 가지고 있음을 보여주는 새로운 고자기 데이터를 추가합니다. 이전 작업의 맥락에서 이것은 반전이 있는 초기 홍적세의 3개의 자기층서학적 간격과 일치합니다: 1.93 Myr(시나리오 1), 2.14 Myr(시나리오 2) 또는 2.58 Myr(시나리오 3)(보충 정보, 섹션 1 ). 또한, 우리는 이 연구에서 4개 장소에서 회원 B의 매장 날짜를 우주 발생 26 Al: 10 Be 매장 날짜를 사용하여 연령을 제한합니다(보충 정보, 섹션 3 ). Kap København Formation의 권장 최대 매장 연령은 2.70 ± 0.46 Myr입니다(그림 2; 행동 양식). 그러나 이전 시나리오 3은 단일 빙하-간빙기 퇴적 주기 7 , 14 , 16 , 18 , 19 동안 구성원 A와 B에 걸친 지속적인 퇴적에 대한 증거와 모순되기 때문에 폐기합니다 . 따라서 시나리오 1은 1.9 Myr의 수명을 지원하고 시나리오 2는 2.1 Myr의 수명을 지원하는 두 가지 가능한 시나리오(시나리오 1 및 2)를 남깁니다.
그림 2: Kap København Formation의 연령 프록시.
a , 수정된 고자기 분석은 B2 장치가 정상적인 극성을 가지고 있으며 구성원 A(파란색) 및 B(갈색)를 포함하여 세 가지 가능한 연령 시나리오(S1–S3)를 잠금 해제하는 것으로 나타냅니다. 정상적인 극성은 검은색으로 표시되고 반대 극성은 흰색으로 표시됩니다. 자, 자라밀로; 공동, Cobb 산; 올, 올두바이; 페, 페니; 카, 카에나; 엄마, 매머드. b , 높은 북극, 북반구 및 북 그린란드에서 해양 유공충 Cibicides Grossus , 토끼 속 Hypolagus 및 연체 동물 Arctica islandica 에 대한 존재 및 마지막 모양 데이터 (LAD) . 맨 오른쪽의 파란색 띠는 껍질의 아미노산 비율에서 추정한 구성원 A의 연령 범위를 나타냅니다 7 . 씨, 두 가지 다른 생산 비율(7.42(검은색) 및 6.75(파란색))에 대해 계산된 우주기원 매장 연령에 대한 컨볼루션된 확률 분포 함수. 파선과 실선은 각각 꾸준한 침식과 제로 침식에 대한 분포를 보여줍니다. 이러한 분포는 모두 최대 연령입니다. d , Betula 의 분자 연대 측정sp. 1억 반복에 대해 Markov chain Monte Carlo 추정을 실행하여 0.68에서 2.02 Myr(파란색 밀도 플롯)의 95% 사후 밀도(HPD)를 제한하는 위스커와 함께 1.323 Myr의 퇴적물에서 DNA의 중간 나이를 산출합니다. 빨간색 점은 방사성 탄소 연대표본으로 제한되는 마스토돈 미토콘드리아 게놈을 사용하여 발견된 평균 분자 연령 추정치인 반면, 녹색 영역은 4억 반복 동안 마르코프 연쇄 몬테카를로 추정을 실행하는 BEAST의 분자 시계 추정 표본을 포함합니다. 위스커는 95% HPD를 제한합니다.
DNA 보존
DNA는 미생물 효소 활동, 기계적 전단 및 가수분해 및 산화와 같은 자발적인 화학 반응으로 인해 시간이 지남에 따라 분해됩니다 20 . 지금까지 얻은 가장 오래된 알려진 DNA는 지질학적 방법을 사용하여 1.2–1.1 Myr로 추정되는 영구 동토층에 보존된 매머드 어금니와 분자 시계 연대를 사용하여 1.7 Myr(95% 최고 후방 밀도, 2.1–1.3 Myr)에서 복구되었습니다 21 . Kap København 지층의 퇴적물에서 DNA를 회수할 가능성을 알아보기 위해 Kap København 지층에서 DNA의 열 연령과 예상되는 탈퓨린화 정도를 계산했습니다. 평균 평균 기온 22 사용(MAT) -17 °C에서 우리는 일정한 10 °C에서 DNA에 대해 2.7 천년의 열적 나이를 발견했으며 이는 2.0 Myr의 나이보다 741배 적습니다(보충 정보, 섹션 4 및 보충 표 4.4.1 ). Moa 조류 화석 23 의 탈퓨린화 속도를 사용하여 우리는 50 염기쌍(bp)의 평균 크기를 가진 DNA가 Kap København Formation에서 생존할 수 있다는 것이 타당하다는 것을 발견했습니다 . 표 4.4.2). 퇴적물에서 DNA를 보존하는 메커니즘은 뼈와 다를 가능성이 높습니다. 광물 표면에서의 흡착은 DNA 형태를 수정하여 아마도 효소에 의한 분자 인식을 방해하여 효소 분해를 효과적으로 방해합니다 24 , 25 , 26 , 27 . Kap København Formation에서 발견된 광물이 퇴적 동안 DNA를 유지하고 보존할 수 있었는지 여부를 조사하기 위해 X선 회절을 사용하여 퇴적물의 광물학적 구성을 결정하고 흡착 능력을 측정했습니다. 우리의 발견은 해양 퇴적 환경이 광물 표면에서 세포 외 DNA의 흡착을 선호한다는 것을 강조합니다 (보충 정보, 섹션 4 및 보충 표4.3.1.1 ). 구체적으로 점토 광물(9.6~5.5wt%)과 특히 스멕타이트(1.2~3.7wt%)는 비점토 광물(59~75wt%)에 비해 흡착력이 더 높다. 자연 환경을 대표하는 DNA 농도 28 (4.9 ng ml -1 DNA)에서 스멕타이트의 DNA 흡착 능력은 석영보다 200배 더 큽니다. 우리는 광물 흡착 DNA 샘플에 퇴적 eDNA 추출 프로토콜 29 를 적용하고 스멕타이트에서 흡착된 DNA의 5%만 검색하고 다른 점토 광물에서 약 10%를 검색했습니다(방법 및 보충 정보, 섹션 4). 대조적으로, 우리는 석영에 흡착된 DNA의 약 40%를 회수했습니다. 서로 다른 광물의 흡착 능력과 추출 수율의 차이는 광물 구성이 고대 eDNA 보존 및 검색에 중요한 역할을 할 수 있음을 보여줍니다.
Kap København 메타게놈
Kap København Formation(보충 정보, 섹션 6 및 소스 데이터 1) 내의 5개 사이트에서 41개의 유기물이 풍부한 퇴적물 샘플에서 DNA 29 를 추출 하여 65개의 이중 인덱스 Illumina 시퀀싱 라이브러리로 변환했습니다 30 . 먼저, 39-bp 영역과 P7 인덱스에 걸쳐 있는 유전자 표적 프라이머 및 프로브가 있는 ddPCR(droplet digital PCR)을 사용하여 보존된 광계 II D2( psbD ) 유전자를 스크리닝하여 식물 색소체 DNA에 대한 65개 라이브러리 중 34개를 테스트했습니다. 뇌관. 또한 Poaceae를 대상으로 하는 유사한 분석을 사용하여 psbA 유전자를 스크리닝했습니다 (방법 및 보충 그림 6.12.1). 테스트된 34개 샘플 중 31개에서 명확한 신호가 이러한 라이브러리에 식물 색소체 DNA의 존재를 확인했습니다(소스 데이터 1, 시트 5 및 6). 또한 65개 라이브러리 중 34개를 Arctic PaleoChip 1.0 31 을 사용하여 포유류 mtDNA 포획 강화에 적용 했고 샷건은 Illumina HiSeq 4000 및 NovaSeq 6000을 사용하여 모든 라이브러리(초기 및 캡처)를 시퀀싱했습니다. 총 16,882,114,068개의 판독이 시퀀싱되었으며 어댑터 후 트리밍, 30bp 이상에 대한 필터링 및 최소 phred 품질 30 및 중복 제거 결과 2,873,998,429개의 판독이 발생했습니다. 이들은 simka 32 (보충 정보, 섹션 6 )를 사용하여 k- mer 비교를 위해 분석된 다음 HOLI와의 경쟁 매핑을 사용하여 분류학적 분류를 위해 구문 분석되었습니다.https://github.com/miwipe/KapCopenhagen.git ), 여기에는 북극 및 아한대 식물 분류군 33 , 34 의 1,500개 이상의 게놈 스킴의 최근 공개된 데이터 세트가 포함됩니다 (방법 및 보충 정보, 섹션 6 ). 샘플의 나이와 최근 참조 게놈에 대한 잠재적인 유전적 거리를 고려하여 각 판독값이 ngsLCA를 사용하여 분류학적으로 분류되도록 95-100%의 유사성을 갖도록 허용했습니다 35 . 이후 metaDMG(v.0.14.0) 프로그램( 36 ) 을 사용하여 모든 metagenomic 샘플(방법)에 대한 사후 DNA 손상에 대한 각 분류학적 노드를 정량화하고 필터링했습니다. 이 방법은 말단 위치(D-max) 및 우도비(λ)에서의 평균 손상을 추정합니다.- LR) 손상 모델(즉, 읽기 시작 시 더 많은 손상)이 null 모델(즉, 일정한 손상 양, 6 절 보충 정보 참조)과 비교하여 데이터에 얼마나 더 잘 맞는지를 정량화합니다 . 우리는 특히 진핵생물의 경우 DNA 손상이 크게 증가한다는 것을 발견했습니다(평균 D-max = 40.7%, 보충 정보, 섹션 6 참조). 여기에서 추가 다운스트림 분석을 위해 구문 분석할 분류학적 노드의 필터링 임계값으로 D-max ≥25%를 설정하고 λ -LR은 1.5 이상입니다. 또한 분류군당 최소 읽기 수가 낮은 분류군을 필터링하기 위해 모든 분류군에 할당된 읽기의 중앙값을 2로 나눈 값을 초과하도록 요구하는 임계값을 설정했습니다. 마찬가지로 샘플을 고려하려면 샘플의 총 읽기 수는 읽기 수가 가장 적은 샘플을 필터링하기 위해 샘플당 읽기 수 중앙값을 2로 나눈 값을 초과해야 했습니다. 마지막으로 우리는 3개 미만의 복제본을 가진 분류군을 걸러내고 이후에 비율로 변환하여 판독값을 정규화했습니다(그림 3 및 4a ).
그림 3: 북부 그린란드의 초기 홍적세 식물.
metagenomes에서 발견되는 식물 집합체의 분류학적 프로필. 굵게 표시된 분류군은 거대 화석이나 꽃가루가 아닌 DNA로만 발견되는 속입니다. 별표는 다른 Pliocene Arctic 사이트에서 발견되는 것을 나타냅니다. 거대화석이나 계통 발생 위치에 의해 식별된 멸종 종은 단검으로 표시됩니다. Pyrus 및 Malus 로 분류된 읽기 는 파운드 기호로 표시되며 아마도 참조 게놈으로 존재하지 않는 Rosaceae 내의 다른 종에 속하는 과도하게 분류된 DNA 서열일 것입니다.
그림 4: 북부 그린란드의 초기 홍적세 동물.
a , 단위 B1, B2 및 B3의 동물 집합체의 분류학적 프로필. 굵게 표시된 분류군은 DNA로만 발견되는 속입니다. b , 코끼리과 또는 그 이하로 고유하게 분류된 미토콘드리아 판독의 계통 발생적 배치 및 pathPhynder 62 결과(소스 데이터 1). 거대화석이나 계통 발생 위치에 의해 식별된 멸종 종은 단검으로 표시됩니다.
DNA, 꽃가루 및 대형 화석 비교
그린란드의 해안은 약 60°에서 83° N까지 확장되며 아북극에서 북극 사막까지의 생물 기후대를 포함합니다 37 , 38 . 역사적으로 도입된 종 39 , 40 , 41 을 제외하고 그린란드에 자생하는 175개의 관다발 식물 속이 있습니다. 이 중 70개(40%)가 metagenomic 분석에 의해 검출되었습니다(그림 3 ). 이 속의 대부분은 오늘날 Kap København의 극지 사막 남쪽에 있는 생물 기후대에 국한되어 있습니다(참조 42 및 참조). Salix , Dryas , Vaccinium , Betula 에 할당된 읽기 ,Carex 와 Equisetum 이 집합체를 지배하고 있으며, 이들 속 중에서 Equisetum , Dryas , Salix arctica 및 Carex의 두 종 ( Carex nardina 및 Carex stans )이 현재 이곳에서 자라고 있습니다 . nana 는 74º N 이상에서 발견됩니다( 43 참조 ). Kap København 고대 eDNA 집합체에서 발견된 102개 속 중 39%는 더 이상 그린란드에서 자라지 않지만 북미 아한대 지역에서 발생합니다(예: Picea 및 Populus) 및 북부 낙엽수림 및 해양림(예: Crataegus , Taxus , Thuja 및 Filipendula ). 이 다양한 집합체의 많은 식물 속은 영구 동토층 기질에서 발생하지 않으며 오늘날 그린란드의 어떤 위도보다 더 높은 온도를 필요로 합니다.
DNA 외에도 지역 119, 단위 B3의 6개 샘플에서 꽃가루를 세었습니다(방법 및 보충 그림 5.1.1 ). 꽃가루 합계가 71-225개 지상파 곡물(평균 = 170.25)인 샘플 4개에 대해 백분율을 계산했습니다. 사초과, 진달래과 및 장미과의 분류군을 포함한 고지대 허브는 샘플 4의 약 40%를 구성했습니다. 샘플 5와 6은 수목 분류군, 특히 Betula 가 지배했습니다 . Polypodiopsida(예: Equisetum , Asplenium 및 Athyrium filix-mas ) 및 Lycopodiopsida( Lycopodium annotinum 및 Selaginella rupestris )도 잘 대표되었으며 샘플 1, 4 및 6에서 집합체의 30% 이상을 구성했습니다.
DNA로 확인된 102개 식물 속 중 총 39개 식물 속도 속 수준에서 거대화석이나 꽃가루로 발생했다. 추가로 39개 분류군은 잠재적으로 거대화석 또는 꽃가루로 확인되었지만 동일한 분류 수준 10 , 15 (소스 데이터 1, 시트 1 및 2)이 아닙니다. 예를 들어, 벼과(Poaceae)의 12개 속( Alopecurus , Anthoxanthum , Arctagrostis , Arctophila , Calamagrostis , Cinna , Dupontia , Hordelymus , Leymus , Milium , Phippsia 및 Poa ) 이 DNA에 의해 식별되었습니다.Hordelymus 는 오늘날 북극에서 발견되지 않지만( http://panarcticflora.org/ ) 꽃가루 분석에서 과 수준으로만 구별되었으며 Poaceae 거대화석은 단 한 개만 발견되었습니다. DNA로만 기록된 분류군은 24개였다. 여기에는 아한대 나무 Populus 와 몇 개의 관목 및 난쟁이 관목이 포함되지만 주로 초본 식물입니다. 거대화석10,15으로 회수된 73종의 식물 속 중 DNA 분석에서 24종만이 검출되지 않았다 . 거대화석과 DNA는 유사한 타포노미를 가지고 있기 때문에(둘 다 지역적으로 퇴적되기 때문에) 일반적으로 지역적으로 분산되어 있는 DNA와 꽃가루 사이보다 그들 사이에 더 많은 중첩이 예상됩니다 44. DNA에 없는 분류군 중 9개는 선태류였는데, 아마도 게놈 참조 데이터베이스 내에서 이 그룹이 제대로 표현되지 않았기 때문일 것입니다. 또한, 멸종 분류군 Araceae는 참조 데이터베이스에 존재하지 않습니다. 발견되지 않은 나머지 속은 관다발 식물이었고, 2개( Oxyria 및 Cornus )를 제외한 모든 속은 거대화석 기록에서 드물었습니다. 희귀 분류군의 탐지는 거대화석과 DNA 기록 모두에서 어렵기 때문에 45 , 우리는 DNA와 거대화석 기록 사이의 중복이 두 방법의 한계를 기반으로 예상할 수 있는 만큼 높다고 주장합니다.
여기에 제시된 꽃가루 기록과 Bennike 46 의 기록 에는 4개의 나무 또는 관목, 5개의 양치류, 3개의 곤봉 이끼, 조류, 균류 및 간장 각각 1개씩 포함된 추가 19개 분류군이 기록되었습니다. 우리는 또한 식물이 실제로 자라는 지역의 훨씬 북쪽에 분포할 수 있는 풍속수, 특히 겉씨식물의 꽃가루를 발견합니다 10 . 베니키 46또한 클럽 이끼와 양치류의 높은 비율을 언급하고 포자 벽이 분해에 저항하기 때문에 과도하게 나타날 수 있다고 제안합니다. 더욱이 이들 분류군이 하구로 흐르는 하천을 따라 우선적으로 분포된다면, 이들의 포자는 보다 일반적으로 분포된 분류군의 꽃가루보다 충적층에 상대적으로 더 많이 집중될 수 있다. 따라서 붕괴 저항과 충적 퇴적 모두 우리가 관찰하는 상대 빈도에 기여할 수 있습니다. 이와 동일한 충적 역학이 Salix , Betula , Populus , Carex 및 Equisetum 에 대한 매우 많은 판독 수에 기여했을 수도 있습니다.metagenomic 기록에서 꽃가루 기록이나 판독 횟수에서 이러한 분류군의 비율이 바이오 매스 또는 적용 범위 측면에서 지역 식생의 실제 풍부함과 반드시 관련이 없음을 의미합니다.
마지막으로, 우리는 엽록체 DNA의 계통 발생적 배치를 통해 식물 DNA의 연대를 측정하고자 했습니다. 우리는 Betula , Populus 및 Salix 속에 대한 데이터를 조사 했는데, 이는 이들이 충분히 높은 엽록체 게놈 범위(각각 평균 깊이 24.16×, 57.06× 및 27.04×)와 충분한 현재 전체 엽록체 참조 서열(방법)을 가지고 있기 때문입니다. 연령과 현대 참조 게놈과의 잠재적인 유전적 거리로 인해 고유하게 분류된 읽기의 유사성 임계값을 90%로 낮추고 적용 범위를 늘리기 위해 단위별로 병합했습니다. Betula 와 Salix 는 각각 의 속에서 대표되는 대부분의 종과 Populus 에 기본적으로 배치됩니다.배치 결과는 P. trichocarpa 및 P. balsamifera 와 관련된 다양한 종의 혼합에 대한 지원을 보여주었습니다 (확장 데이터 그림 7 - 9 ).
우리는 Betula 엽록체 판독값을 분자 연대 분석에 사용했습니다. 왜냐하면 Betula 엽록체 판독값은 계통수(즉, Populus 와 같은 혼합이 아님 )의 단일 가장자리에 자신 있게 배치되었고 많은 수의 참조 서열을 가지고 있었고 고대 샘플. 우리는 BEAST 47 v1.10.4를 사용하여 고대 Betula 엽록체 샘플에 대한 분자 시계 날짜 추정치를 얻었습니다(자세한 내용은 방법, '분자 연대 측정 방법' 참조). 우리는 31개의 현대 베툴라 와 1개의 알누스 엽록체 참조 서열을 포함했고, 고대 샘플에서 최소 20개의 깊이를 가진 사이트만 사용했으며, 이전에 추정된 베툴라-알누스 엽록체 발산 시간 을 포함했습니다.루트 노드의 교정을 위한 61.1 Myr의 48 . 우리의 BEAST 분석은 고대 샘플의 나이에 대한 서로 다른 사전과 서로 다른 뉴클레오티드 치환 모델 모두에 대해 강력했습니다(Extended Data Fig. 10 ). 이것은 (0.6786, 2.0172) Myr의 95% HPD와 함께 1.323 Myr의 평균 연령 추정치를 산출했습니다(그림 2 ).
동물 DNA 결과
후생동물의 미토콘드리아 및 핵 DNA 기록은 식물보다 훨씬 덜 다양했지만 오늘날 그린란드에는 없는 하나의 멸종된 가족과 그린란드에 서식하는 4개의 척추동물 속 및 4개의 무척추동물 대표를 포함하고 있습니다(그림 4a ) . . 할당은 참조 게놈의 불완전하고 가변적인 표현을 기반으로 했기 때문에 가족 수준에 대한 읽기를 식별했으며 충분한 미토콘드리아 읽기가 있는 경우에만 보다 완전한 현재 미토콘드리아에 기반한 미토콘드리아 계통발생수와 일치시켜 속 수준에 대한 할당을 개선했습니다. 시퀀스(보충 정보, 섹션 6). 식물 읽기의 경우 유사도가 90% 이상인 고유하게 분류된 동물 읽기를 구문 분석하고 단위별로 병합하여 계통 발생적 배치에 대한 적용 범위를 높였습니다.
특히 코끼리와 매머드를 포함하지만 분류학적으로 마스토돈( Mammut sp.)이 아닌 코끼리과에 할당된 유닛 B2 및 B3에서 읽기를 발견했습니다. 따라서 Elephantidae 이하에는 Mammut sp.가 포함됩니다. 우리 Elephantidae 미토콘드리아 읽기의 합의 게놈은 Mammut sp. 가지(그림 4b )이며 마스토돈의 모든 분기군에 기초가 됩니다. 그러나 우리는 마스토돈 내에서의 이러한 배치가 오직 2개의 전이 SNP(single-nucleotide polymorphisms)에만 의존한다는 점에 주목합니다. 첫 번째는 3의 판독 깊이에 의해 지원되고 두 번째는 1에 의해서만 지원됩니다(확장 데이터 그림 4, 방법 및 보충 정보, 섹션 6 ). 또한 BEAST49를 사용하여 복구된 마스토돈 미토콘드리아 게놈의 연대 측정을 시도 했습니다 . 우리는 두 가지 연대 측정 방식을 시행했는데, 하나는 방사성 탄소 연대표본만을 사용하는 것이고, 다른 하나는 방사성 탄소 연대측정 및 분자 연대측정 마스토돈을 사용하는 것입니다. 첫 번째 분석에서는 마스토돈 미토겐의 평균 연령 추정치 1.2 Myr(95% HPD: 191,000 yr–3.27 Myr)를 얻었고, 두 번째 접근 방식에서는 5.2 Myr(95% HPD: 1.64–10.1 Myr)의 평균 연령 추정치를 얻었습니다. 보충 그림 6.8.5 및 보충 정보, 섹션 6 ).
마찬가지로 Cervidae에 할당된 읽기는 Rangifer (순록 및 순록) 가지의 기본 배치를 지원합니다(확장 데이터 그림 3 ). 미토콘드리아 는 화석 기록에서 발견된 유일한 포유동물인 유라시아 토끼 클레이드(Extended Data Fig. 2 ) 의 기저 근처에 있는 Leporidae(토끼와 토끼)에 대한 매핑을 읽습니다 7 . Lepus , 특히 Lepus arcticus 는 오늘날 그린란드에 서식하는 Leporidae의 유일한 속이기도 합니다. Cricetidae에 할당된 Mitochondrial 읽기는 Arvicolinae 아과(voles, lemmings 및 muskrats)에서 파생된 정보를 제공하는 하나의 정보 변환 SNP만 포함합니다(Extended Data Fig. 6). 거위와 백조의 가족인 오리과(Anatidae) 데이터세트에 나타난 유일한 조류 분류군에 대해 우리 는 2~4개 범위의 판독 깊이를 가진 3개의 횡단 SNP에 의해 지원되는 검은 거위의 Branta 속에 대한 강력한 기초 배치를 발견했습니다(Extended Data Fig. .5 ) . 미토콘드리아 참조를 기반으로 한 정제된 척추동물 지정은 식물보다 생물지리학적으로 더 잘 보존됩니다. Dicrostonyx — 특히 Dicrostonyx groenlandicus (Nearctic collared lemming) — Rangifer — 특히 Rangifer tarandus groenlandicus 와 마찬가지로 오늘날 그린란드에 서식하는 Cricetidae의 유일한 속입니다.(불모지 순록)—Cervidae의 유일한 구성원입니다. 마스토돈은 예외입니다. 코끼리과의 어떤 구성원도 현재 그린란드에 살지 않기 때문입니다.
해양 생물의 고대 DNA
DNA 기록에서 확인된 다른 후생동물 분류군은 산호초를 만드는 단일 산호(Merulinidae)와 여러 절지동물로 두 곤충(개미과(개미)과 풀리과(벼룩))과 하나의 해양 과인 Limulidae(말굽게)와 일치했습니다. Formica 를 포함하여 200종이 넘는 종으로 구성된 Kap København Formation의 풍부한 곤충 거대화석 기록을 고려할 때 이것은 다소 예상치 못한 일입니다.sp. 해양 분류군은 육상 분류군보다 덜 풍부하고 해양 후생동물에서 미토콘드리아 DNA가 확인되지 않았습니다. 판독 길이, DNA 손상 및 할당된 판독이 참조 게놈 전체에 고르게 분포된다는 사실은 이것이 인공물이 아니라 현재 참조에 없는 과 내에서 밀접하게 관련되어 잠재적으로 멸종된 종의 DNA 서열이 과도하게 일치할 수 있음을 시사합니다. 열악한 분류학적 표현으로 인한 데이터베이스. 대조적으로, Chelicerata 아문에 있는 Limulidae 는 이 별개의 속이 그 목에서 유일하게 살아남은 구성원이고 따라서 다른 현존하는 유기체로부터 깊이 분기되었기 때문에 잘못 식별될 가능성이 없습니다.
이러한 판독값의 가능한 출처는 Limulus polyphemus 속의 유일한 대서양 구성원인 Limulus polyphemus 의 개체군으로, 축적될 때 퇴적물에 직접 산란했을 것입니다. 오늘날 이 속은 펀디만 북쪽(약 45° N)에서 산란하지 않으며, 이는 해안의 홍적세에 대해 재구성된 +8 °C 연간 해수면 온도 편차와 일치하는 Kap København의 초기 홍적세에서 더 따뜻한 지표수 조건을 제안합니다. 그린란드 북동부 50 . Tara Oceans eukaryotic metagenomicassembled genomes(SMAGs) 데이터(방법) 에 대한 판독값을 정렬함으로써 동물성 플랑크톤과 식물성 플랑크톤을 모두 포함하는 14개 샘플에서 24개의 해양 플랑크톤 분류군의 존재를 추가로 밝힙니다(그림 5 ).). 이러한 감지된 SMAG는 상위 그룹 Opisthokonta(6), Stramenopila(15) 및 Archaeplastida(3)에 속합니다. 이러한 신호의 대부분은 규조류(Bacillariophyta), Chrysophyceae 및 MAST-4 그룹(보충 표 6.11.1 ) 과 같은 현대 해양(즉, 북극해 및 남극해)의 추운 지역과 관련된 SMAG에서 발생합니다 . 우리가 예상한 대로. 그러나 일부는 국제적인 반면 Archaeplastida(녹색 미세조류)와 같은 다른 것들은 오늘날 태평양의 더 온화한 해역에 국한된 해양 신호를 가지고 있습니다(그림 5 ).). 현대 생태학이 고대 생태계로 추정될 수 있는지 여부는 알 수 없지만, 녹조류의 풍부함은 지표수 온난화와 관련이 있는 북극 지역에서 증가하고 있는 것으로 여겨집니다.
그림 5: Kap København Formation에서 확인된 해양 플랑크톤 진핵생물.
a , 구성원 단위 내 SMAG의 감지 및 SMAG의 평균 손상(D-max). 상단, Delmont et al.의 데이터를 기반으로 한 현대 해양의 SMAG 분포. 63 . SMAG는 Delmont et al. 63 . b – d , 분류학적 수퍼그룹 Opisthokonta( b ), Stramenopila( c ) 및 Archaeplastida( d ) 사이의 DNA 손상 분포 (소스 데이터 1).
논의
Kap København 고대 eDNA 기록은 몇 가지 이유로 특별합니다. 추정된 분자 연령의 95% 최고 사후 밀도의 상한은 2.0 Myr이며 독립적으로 약 2 Myr의 지질학적 연령을 지원합니다(그림 2 ). 이것은 DNA가 이전에 시퀀싱된 DNA 21 보다 상당히 오래되었다는 것을 의미합니다 . 우리의 DNA 결과는 고대 퇴적물의 샷건 시퀀싱을 사용한 이전 연구보다 5배 더 많은 식물 속을 탐지했으며 29 , 34 , 51 , 52 , 이는 가장 풍부한 북부 아한대 메타바코딩 기록의 범위 내에 있습니다 53. 할당의 정확성은 속 또는 과 수준으로 확인된 분류군의 76%가 동일한 단위의 거대화석 및/또는 꽃가루 집합체에서도 발생했다는 관찰에 의해 강화됩니다. 우리의 결과는 고대 환경을 재구성하고, 약 200만 년 전의 다양한 분류군의 고대 혈통을 계통발생학적으로 배치하고 날짜를 지정하는 고대 환경 메타지노믹스의 잠재력을 보여줍니다(보충 정보, 섹션 6 ). 마지막으로, DNA는 다른 북극 후기 Pliocene 및 Early Pleistocene 사이트에서 거대 화석으로 발생하는 일련의 추가 식물 속을 확인했습니다(그림 1 및 3 및 보충 정보, 섹션 5 ).) 그러나 Kap København의 화석은 아니므로 이러한 고대 식물군의 시공간 분포를 확장합니다.
주목할 점은 랑기퍼 (순록과 순록)와 마 무트 (마스토돈)가 모두 발견되면서 상대적으로 빈약한 이 지역의 동물군 기록을 기반으로 한 초기의 고생물학적 재구성을 수정하게 되었고, 퇴적 기간의 대부분 동안 더 높은 생산성과 서식지 다양성을 수반했습니다. DNA로 확인된 모든 척추동물 분류군은 초식동물이기 때문에 이들의 표현은 상대적인 생물량의 함수일 수 있습니다(보충 정보 섹션 6 의 타포노미에 대한 논의 참조 ). 순록, 거위, 산토끼 및 설치류는 아한대 환경에서 적어도 계절적으로는 모두 풍부할 수 있습니다. 또한, 대형 초식 동물(예: 순록 및 특히 마스토돈)의 배설물은 퇴적물의 중요한 구성 요소가 될 수 있습니다 34. 대조적으로 육식 동물은 더 작은 총 바이오 매스와 일치하여 표시되지 않습니다. 이 역학은 또한 후생 동물에 대한 식물 읽기의 우세와 다양한 식물 속 표현의 어느 정도 차이를 설명합니다 (보충 정보, 섹션 6 ). 일반적으로 화석이 없는 상황에서 DNA는 초기 홍적세를 통해 척추동물의 생물지리학을 재구성하는 가장 효과적인 도구임을 입증할 수 있습니다. 마스토돈의 DNA는 이 거대 초식동물의 생존 가능한 개체군을 의미해야 하며, 이는 주로 식물 거대화석에 기반한 초기 재건에서 추론한 것보다 더 생산적인 아한대 서식지를 필요로 할 것입니다 7. 약 75,000년 전 노바 스코샤 중부 지역의 마스토돈 똥에는 사초, 부들, 갈대, 선태류 및 심지어 엽록소에서 나온 거대화석이 포함되어 있지만 가문비나무 바늘과 자작나무 사마라가 지배적이었습니다 54 . 마스토돈 DNA를 가진 Kap København 단위는 Betula 의 거시화석과 DNA 뿐만 아니라 Thuja , Taxus , Cornus 및 Viburnum 을 포함하여 더 호열성 수목류 분류군을 산출했으며, 이들 중 어느 것도 오늘날 그린란드의 하이드릭 북극 툰드라 또는 극지방 사막에 포함되지 않습니다. 여러 단위에서 이러한 분류군의 동시 발생은 영구 동토층의 존재뿐만 아니라 이전 온도 추정치의 수정을 강요합니다.
단일 현대 식물 군집이나 서식지에는 Kap København의 많은 거대 화석 및 DNA 샘플에서 나타나는 다양한 분류군이 포함되어 있지 않습니다. 군집 군집은 현대 식생 10 , 15 에서 유사하지 않은 현대 아한대 및 북극 분류군의 혼합을 나타냅니다 . 이러한 속의 현생 구성원의 생태적 진폭이 진화에 의해 수정되었기 때문에 어느 정도 이것은 예상됩니다 55 . 더욱이, 더 따뜻한 조건과 더 낮은 대기 CO 2 농도 를 가진 높은 북극 광주기의 조합 56북부 그린란드의 초기 홍적세 기후는 오늘날과 매우 다릅니다. 육상 군집의 혼합된 특성은 해양 기록에도 반영되어 있으며, Opistokonta 및 Stramenopila의 북극 및 보다 국제적인 SMAG가 투구게, 산호 및 녹색 미세조류(Archaeplastida)와 함께 발견되며, 오늘날 더 남쪽 위도의 따뜻한 물에 서식합니다.
Megaherbivores, 특히 마스토돈은 간빙기 타이가 환경에 상당한 영향을 미쳤을 수 있으며 심지어 이 고위도에서 식생 구조와 구성에 대한 하향식 영양 제어를 제공할 수도 있습니다. 마스토돈의 존재 57 , 58 는 일부 홀로세 아한대 서식지에서 역할을 한 인위적인 화재의 부재와 결합되었습니다 59, 중요한 차이점입니다. 또 다른 중요한 요소는 간빙기가 시작될 때 조건이 좋아졌을 때 개척자 종이 북 그린란드로 흩어질 수 있었던 레퓨지아의 근접성과 생물적 풍부성입니다. 더 짧은 기간의 초기 홍적세 빙하는 덜 광범위한 빙상을 생성하여 캐나다 북동부의 상대적으로 종이 풍부한 침엽수 낙엽 삼림 지대에서 식민지화를 허용했습니다 12 , 60 . 후기 홍적세의 더 광범위한 빙하는 점점 더 북 그린란드를 고립시켰고 이후의 재식민화는 점점 더 멀어지고 덜 다양한 레퓨지아에서 비롯되었습니다.
요약하면, 우리는 북극 종과 혼합된 이 독특하고 고대 개방된 아한대 삼림 공동체에 대한 우리의 지식에 상당한 세부 사항을 추가하는 고대 eDNA의 힘을 보여줍니다. 유사하게 상세한 식물상 및 척추동물 DNA 기록은 다른 지역에서도 살아남을 수 있습니다. 복구된다면 북극권 전역의 더 따뜻한 초기 홍적세 시대 동안 기후 및 생물 상호 작용의 가변성에 대한 이해를 향상시킬 것입니다.
행동 양식
견본 추출
퇴적물 샘플은 2006년, 2012년 및 2016년 여름에 North Greenland(82° 24′ 00″ N 22° 12′ 00″ W)의 Kap København Formation에서 얻었습니다(보충 표 3.1.1 참조).). 샘플 재료는 유기물이 풍부한 영구동토층과 건조한 영구동토층으로 구성되었습니다. 샘플링 전에 프로파일을 청소하여 새로운 재료를 노출시켰습니다. 샘플은 이후 10cm 직경의 다이아몬드 헤드 드릴 비트를 사용하거나 ~40 × 40 × 40cm 블록을 절단하여 언덕의 경사면에서 수직으로 수집되었습니다. 퇴적물은 현장에서 그리고 코펜하겐의 실험실 시설로 운송하는 동안 동결된 상태로 유지되었습니다. 교차 오염을 피하기 위해 일회용 장갑과 메스를 사용하고 각 샘플 간에 교체했습니다. 통제된 실험실 환경에서 코어와 블록은 침전물 코어의 내부 부분만 취하여 내부 코어와 표면 사이에 약 6-10g의 하위 샘플을 제공하는 1.5-2cm를 남기고 재료에 대해 추가로 하위 샘플링되었습니다. 그 후, 모든 샘플은 -22 °C 이하의 온도에서 보관되었습니다.
우리는 50(B3), 69(B2), 74a(B1), 74b(B1) 및 119(B3). 각 사이트에서 각 유닛의 각 생물학적 복제물은 다른 하위 계층(L0-L4 번호, 소스 데이터 1, 시트 1)에서 추가로 샘플링되었습니다.
절대연령연애
2014년에 하천 절단 테라스 아래 3~21m 깊이에서 수집된 8×1kg 석영이 풍부한 모래 샘플의 Be 및 Al 산화물 표적을 가속기 질량 분석법으로 분석했으며 우주 생성 동위원소 농도는 간단한 방법을 사용하여 최대 연령으로 해석되었습니다. 매장 연대 측정법 1 ( 26 Al: 10 Be 대 정규화된 10 Be). 26 개의 Al 및 10개의 Be 동위원소 는 퇴적 전에 Kap København 위 산의 표토 및 기반암 표면에서 노출된 석영과 우주선 상호작용에 의해 생성되었습니다. 우리는 26 Al: 10Be는 점진적으로 침식되는 고표면의 상부 몇 미터에서 오랜 기간 동안 균일하고 안정적이었습니다. 일단 하천과 언덕 경사면 과정에 의해 침식된 석영 모래는 모래로 엮인 하천 퇴적물, 삼각주 분배 시스템 또는 해안 근처 환경에 퇴적되었으며 퇴적물 아래에 묻힌(수십 미터) 우주선 핵, 간헐적 빙붕으로부터 효과적으로 보호된 상태를 유지했습니다. 또는 빙상 덮개, 그리고 적어도 간빙기 동안에는 최종 출현 때까지 해수 기둥. 단순 매장 연대 측정 방식은 모래 알갱이가 단 한 번의 매장 사건을 경험했다고 가정합니다. 재노출 기간으로 분리된 여러 매장 이벤트가 발생한 경우 시작 26 Al: 10마지막 매장 사건 이전은 매장 동안 26 Al 의 상대적으로 빠른 부패로 인해 초기 생산 비율(6.75에서 7.42, 아래 논의 참조)보다 낮을 것이며 , 따라서 계산된 매장 연령은 최대 제한 연령이 될 것입니다. 수원 지역의 두꺼운 빙하 얼음에 의한 차폐 또는 최종 퇴적 전에 유역의 퇴적물 저장으로 인해 다중 매몰 사건이 발생할 수 있습니다. 이러한 차폐 이벤트는 26 Al: 10Be는 더 낮기 때문에 초기 생산 비율을 가정한 계산된 매장 연령은 최종 매장 기간을 과대 평가할 것입니다. 우리는 또한 일단 묻히면 모래 알갱이가 2차 우주 발생 뮤온에 노출되었을 수 있다고 생각합니다(그 깊이는 잠수함 핵생성 생성에 너무 컸을 것입니다). 이러한 빙하 근해 환경의 침강 속도는 상대적으로 빠르기 때문에 뮤온 생성도 무시할 수 있음을 보여줍니다( 보충 정보 참조 ). 그러나 일단 해양 퇴적물이 해수면 위로 나오면 핵형성 및 점액생성 생산에 의한 현장 생산이 26 Al: 10 Be를 변경할 수 있습니다. 26 알 대 10Be isochron 플롯은 이 복잡한 매장 역사(보충 정보, 섹션 3 )와 26 Al 및 10 모두에 대한 농도 대 깊이 합성 프로파일을 보여줍니다.가장 얕은 샘플은 해당 지역의 해빙과 일치하는 기간(~15,000년 전) 동안 노출되었을 수 있음을 밝히십시오(보충 정보). 우리는 모든 샘플의 개별적인 단순 매장 연령을 Kap København Formation Member B의 최대 제한 퇴적 연령으로 해석하지만, 퇴적 후 생산의 영향을 최소화하기 위해 단일 깊이 프로파일에서 가장 깊게 차폐된 3개의 샘플을 사용하는 것이 좋습니다. 그런 다음 이 세 샘플(KK06A, B 및 C)에 대한 컨볼루션된 확률 분포 연령을 계산합니다. 그러나 이 계산은 26 Al: 10 에 따라 다릅니다.우리가 사용하는 생산 비율(즉, 6.75에서 7.42 사이)과 집수지의 침식을 조정하는지 여부입니다. 따라서 우리는 1σ 신뢰도에서 최소 및 최대 제한 연령 범위를 얻기 위해 최저 및 최고 생산 비율과 0에서 최대 가능한 침식률에 대해 컨볼루션된 확률 분포 함수 연령을 반복합니다 (보충 정보, 섹션 3 ). 음수 및 양수 3σ 신뢰 한계 사이의 중간점을 취하면 최대 매장 연령은 2.70 ± 0.46 Myr입니다. 이 연령은 또한 아이소크론 플롯에서 세 샘플의 위치에 의해 뒷받침되며, 이는 실제 연령이 이 최대 제한 연령과 크게 다르지 않을 수 있음을 시사합니다.
열 연령
Kap København DNA의 열 분해 정도를 Krestovka 매머드 어금니의 DNA와 비교했습니다. DNA 분해에 대해 공개된 동역학 매개변수 64 를 사용하여 장기 온도 기록의 주어진 간격에 대한 상대 속도 차이를 계산하고 10°C의 기준 온도로부터의 오프셋을 정량화하여 10°에서 열 연령(년)을 추정했습니다. 각 샘플에 대한 C(보충 정보, 섹션 4 ). Kap København 퇴적물의 연평균 기온(MAT)은 Funder et al. (2001) 6 그리고 Krestovka Mammoth의 경우 MAT는 Cerskij 기상 관측소(WMO no. 251230) 68.80° N 161.28° E, 32m 떨어진 International Research Institute Data Library(International Research Institute Data Library)의 온도 데이터를 사용하여 계산되었습니다(https://iri.columbia.edu/ ) (보충 표 4.4.1 ).
Kap København 퇴적물 또는 Krestovka Mammoth의 열 연령 계산을 위해 계절 변동을 수정하지 않았습니다. 우리는 Kap København 퇴적물에 있는 DNA에 대한 네 가지 다른 열적 시나리오에 대한 이론적 평균 조각 길이를 제공합니다(보충 표 4.4.2 ). 열 연령 계산의 보정은 환경 감률(6.49 °C km -1 )을 사용하여 고도에 적용되었습니다. 우리는 Hansen 등의 장기 온도 모델을 확장했습니다. (2013) 65 는 마지막 빙하기 최대기의 국지적 온도 감소 추정치를 설명하기에 충분한 배율 인수에 의해 현재 MAT의 국지적 추정치에 65를 적용한 다음 127 kJ mol -1 의 활성화 에너지(Ea)를 사용하여 통합 속도를 추정했습니다 ( 심판64 ).
광물학적 구성
각 Kap København 퇴적물 샘플의 광물은 X-선 회절을 사용하여 식별되었고 그 비율은 Rietveld 정제를 사용하여 정량화되었습니다. McCrone Mill에서 ~1g의 침전물을 에탄올로 10분 동안 분쇄하여 샘플을 균질화했습니다. 샘플을 60°C에서 건조하고 내부 표준으로 커런덤(CR-1, Baikowski)을 최종 농도 20.0wt%로 첨가했습니다. Bruker D8 Advance(Θ–Θ 기하학) 및 LynxEye 검출기(열림 2.71°)를 사용하여 Cu K α1,2 를 사용하여 회절도를 수집했습니다.회절된 빔에서 0.2mm 두께의 Ni 필터와 3mm로 설정된 빔 나이프를 사용하여 방사선(1.54Å; 40kV, 40mA). 샘플이 20rpm에서 회전하는 동안 0.1°의 단계 크기와 4초의 단계 시간으로 5–90° 2θ에서 스캔했습니다. 발산 슬릿의 개구부는 0.3°, 산란 방지 슬릿의 개구부는 3°였다. 1차 및 2차 Soller 슬릿은 2.5°의 개구부를 갖고 검출기 창의 개구부는 2.71°였습니다. Rietveld 분석을 위해 BGMN 소프트웨어용 Profex 인터페이스를 사용했습니다 66 , 67 . 기기 매개변수 및 피크 확대는 기본 매개변수 광선 추적 절차 68 에 의해 결정되었습니다 . 점토 광물의 식별에 대한 자세한 설명은 지원 정보에서 찾을 수 있습니다.
흡착
흡착 연구를 위해 순수 또는 정제된 광물을 사용했습니다. 사용된 미네랄과 이를 정화하기 위한 처리는 보충 표 4.2.6 에 나열되어 있습니다. 광물의 순도는 위의 섹션, 즉 광물학적 조성에 나열된 것과 동일한 기기 매개변수 및 절차를 사용하여 X선 회절을 사용하여 확인했습니다. 원산지, 정제 및 불순물에 대한 참고 사항은 보충 정보 섹션 4 에서 확인할 수 있습니다 . 인공해수 69 를 사용했습니다.및 연어 정자 DNA(저분자량, 동결건조 분말, Sigma Aldrich)를 eDNA 흡착 모델로 사용했습니다. 알려진 양의 미네랄 분말을 해수와 혼합하고 초음파 수조에서 15분 동안 초음파 처리했습니다. 그런 다음 DNA 스톡을 현탁액에 첨가하여 최종 농도가 20–800 μg ml -1 이 되도록 했습니다.. 현탁액을 회전 진탕기에서 4시간 동안 평형화시켰다. 그런 다음 샘플을 원심분리하고 양성 및 음성 대조군 모두와 함께 UV 분광법(Biophotometer, Eppendorf)으로 상청액의 DNA 농도를 측정했습니다. 모든 측정은 3회 수행되었으며 미네랄당 5~8개의 DNA 농도를 만들었습니다. Langmuir 및 Freundlich 방정식을 사용하여 모델을 실험 등온선에 맞추고 주어진 평형 농도에서 광물의 흡착 용량을 얻었습니다.
화분
꽃가루 샘플은 피로인산나트륨과 플루오르화수소산을 이용하는 러시아 과학 아카데미 지질학 연구소에서 채택한 수정된 Grischuk 프로토콜을 사용하여 추출되었습니다 70 . 6개의 샘플로부터 준비된 슬라이드를 Motic BA 400 복합 현미경으로 400배율로 스캔하고 Moticam 2300 카메라를 사용하여 사진을 찍었습니다. 꽃가루 백분율은 미확인 알갱이를 포함한 총 동형체의 비율로 계산되었습니다. 6개 샘플 중 4개만 육상 꽃가루 수가 50 이상이었습니다. 이들에서 확인된 총 palynomorphs의 범위는 225에서 71까지였습니다(평균 = 170.25; 중앙값 = 192.5). 식별은 공개된 여러 키 ( 71 , 72 )를 사용하여 이루어졌습니다 . 꽃가루 다이어그램은 처음에 Tilia 버전 1.5.12를 사용하여 컴파일되었습니다.73 그러나 이 연구를 위해 Psimpoll 4.10 74 를 사용하여 다시 플롯 했습니다.
DNA 복구
회수율 계산을 위해 DNA로 광물 표면을 포화시켰습니다. 이를 위해 우리는 흡착되지 않은 DNA를 제거하기 위해 단계가 추가된 흡착 등온선의 결정과 동일한 프로토콜을 사용했지만 젖은 페이스트의 간극 기공에만 갇혔습니다. 간질 DNA가 분명히 흡착된 DNA의 양을 증가시키고 회복을 과대평가하기 때문에 이 단계는 중요했습니다. 흡착 후 갇힌 DNA를 제거하기 위해 바닷물에 미네랄을 재분산시켰습니다. 습윤 페이스트를 해수에 재분산시키고 초원심분리하고 상청액을 제거하는 과정은 2.5분 미만으로 지속되었다. 두 번째 원심분리 후 젖은 페이스트를 추출할 때까지 냉동 보관했습니다. 우리는 Kap København 퇴적물과 동일한 추출 프로토콜을 사용했습니다. 추출 후, UV 분광법을 사용하여 DNA 농도를 다시 측정하였다.
메타게놈
총 41개의 샘플이 DNA 75 에 대해 추출 되었고 65개의 이중 인덱스 Illumina 시퀀싱 라이브러리로 변환되었습니다(13개의 음성 추출 및 라이브러리 컨트롤 포함) 30. 그 후 34개의 라이브러리를 제조업체의 프로토콜에 따라 QX200 AutoDG Droplet Digital PCR System(Bio-Rad)을 사용하여 ddPCR에 적용했습니다. ddPCR 분석에는 P7 인덱스 프라이머(5'-AGCAGAAGACGGCATAC-3')(900nM), 유전자 표적 프라이머(900nM) 및 유전자 표적 프로브(250nM)가 포함됩니다. Viridiplantae psbD(프라이머: 5'-TCATAATTGGACGTTGAACC-3', 프로브: 5'-(FAM)ACTCCCATCATATGAAA(BHQ1)-3') 및 벼과 psbA(프라이머: 5'-CTCACAACTTCCCTCTAGAC-3', 프로브 5'- (HEX)AGCTGCTGTTGAAGTTC(BHQ1)-3'). 또한 65개 라이브러리 중 34개는 PaleoChip Arctic1.0 미끼 세트 31 를 사용하여 포유류 미토콘드리아 DNA에 대해 표적 포획 강화를 사용하여 강화되었습니다.이후 모든 라이브러리는 Illumina HiSeq 4000 80bp PE 또는 NovaSeq 6000 100bp PE에서 시퀀싱되었습니다. 우리는 총 16,882,114,068개의 읽기를 시퀀싱했으며, 복잡성이 낮은 필터링(Dust = 1), 품질 트리밍( q ≥ 25), 중복 제거 및 29bp보다 긴 읽기에 대한 필터링(NovaSeq 데이터에 대한 쌍 읽기 메이트만) 결과 2,873,998,429개의 읽기가 발생했습니다. 추가 다운스트림 분석을 위해 구문 분석되었습니다. 다음으로 simka 32 (최대 읽기 수(-max-reads 0) 및 k mer 크기 31(-kmer-size 31)에 대한 휴리스틱 카운트 설정)를 사용하여 모든 샘플 간의 k mer 유사성을 추정 하고 주성분 분석을 수행했습니다. (PCA) 획득한 거리 행렬( 보충 정보 참조), 'DNA'). 이후 분류학적 할당을 위해 HOLI 33 을 통해 모든 QC 읽기를 구문 분석했습니다. 분류학적 할당의 해상도와 민감도를 높이기 위해 RefSeq(박테리아 제외 92개)와 뉴클레오타이드 데이터베이스(NCBI)를 최근 발표된 북극-아한대 식물 데이터베이스(PhyloNorway) 및 북극 동물 데이터베이스 34 로 보완했습니다.또한 NCBI SRA에서 아한대 동물 분류군의 139개 게놈(2020년 3월)을 검색했으며 그 중 16개의 부분 전체 게놈이 발견 및 추가되었으며(소스 데이터 1, 시트 4) GTDB 미생물 데이터베이스 버전 95를 미끼로 사용했습니다. 이후 모든 정렬은 samtools를 사용하여 병합되고 gz-sort(v. 1)를 사용하여 정렬되었습니다. 시토신 탈아미노화 빈도는 새로 개발된 metaDMG를 사용하여 먼저 각 판독에 대한 모든 가능한 정렬에서 가장 낮은 공통 조상을 찾은 다음 각 분류 수준에 대한 손상 패턴을 계산함으로써 추정되었습니다 ( 보충 정보 , 섹션 6 ). 동시에 평균 읽기 길이와 분류학적 노드당 읽기 수를 계산했습니다( 보충 정보 , 섹션 6). 모든 분류학적 수준에 걸친 DNA 손상에 대한 우리의 분석은 D-max ≥ 25% 및 우도비(λ-LR) ≥ 1.5인 모든 분류학적 수준의 모든 샘플에 대한 최소 필터를 가리켰습니다. 이를 통해 고대 DNA 특성을 나타내는 분류군만 다운스트림 프로파일링 및 분석을 위해 구문 분석되었고 발견된 컨트롤 내에서 분류군이 발견되지 않았습니다(보충 정보, 섹션 6 ).
해양 진핵생물 메타게놈
우리는 추가 필터링 단계와 결합된 매개 변수 '--confidence 0.5 --minimum-hit-groups 3'을 사용하여 Kraken 2 76 을 사용하여 모든 품질 제어 읽기를 Eukaryota, Archaea, Bacteria 또는 Virus로 분류학적으로 먼저 분류하여 해양 진핵생물을 식별하려고 했습니다. root-to-leaf 점수가 >0.25인 읽기만 유지했습니다. 초기 Kraken 2 검색을 위해 우리는 taxdb-integration 워크플로( https://github.com/aMG-tk/taxdb-integration )에서 생성한 대략적인 데이터베이스를 사용하여 해양 플랑크톤 진핵생물의 게놈 데이터베이스를 포함하여 생명의 모든 영역을 포괄했습니다. Delmont et al . _ _63 , 우리는 그들을 SMAG라고 부를 것입니다. 루트, 미분류, 고세균, 박테리아 및 바이러스로 레이블이 지정된 읽기는 taxdb 통합 워크플로에서 생성된 고세균, 박테리아 및 바이러스가 포함된 고해상도 데이터베이스를 사용하여 두 번째 Kraken 2 레이블 지정 단계를 통해 정제되었습니다. 우리는 초기 검색과 동일한 Kraken 2 매개변수 및 필터링 임계값을 사용했습니다. 두 Kraken 2 데이터베이스는 연구 읽기 길이에 최적화된 매개변수로 구축되었습니다(--kmer-len 25 --minimizer-len 23 --minimizer-spaces 4).
진핵 세포, 뿌리 및 분류되지 않은 것으로 레이블이 지정된 읽기는 이후 SMAG에 대해 Bowtie2 78 로 매핑 되었습니다. Picard( https://github.com/broadinstitute/picard )의 MarkDuplicates를 사용하여 중복을 제거한 다음 filterBAM 프로그램( https://github.com/aMG- tk/bam-필터 ). 또한 metaDMG의 베이지안 방법으로 필터링된 BAM 파일의 사후 손상을 추정하고 D-max ≥ 0.25 및 적합 품질(λ -LR) 1.5 이상. 500개 미만의 판독이 매핑된 SMAG, 평균 판독 평균 뉴클레오티드 동일성(ANI)이 93% 미만, 범위 비율 및 범위 균일성이 0.75 미만인 SMAG는 제거되었습니다. 평균 판독 ANI 임계값을 선택하기 위해 데이터 기반 접근 방식을 따랐습니다. 여기에서 평균 판독 ANI 값의 함수로 매핑된 판독의 변화를 90%에서 100%로 탐색하고 곡선에서 팔꿈치 지점을 식별했습니다(보조 그림 1). 6.11.1 ). 수동 모드에서 anvi'o 79 를 사용하여 Delmont et al이 추론한 SMAG 계통수를 사용하여 매핑 및 손상 결과를 플로팅했습니다. 참조로. 우리는 Delmont et al.의 해양 신호를 사용했습니다. 각 바다와 바다에서 SMAG의 현대 분포에 대한 대리로 (그림 5및 보충 정보, 섹션 6 ).
DNA, 거대 화석 및 꽃가루의 비교
DNA, 대형 화석 및 꽃가루의 기록을 비교할 수 있도록 Pan Arctic Flora 체크리스트 43 및 NCBI에 따라 분류법을 조화시켰습니다. 예를 들어 Bennike(1990) 18 이후 Potamogeton 은 Potamogeton 과 Stuckenia 로 분리되었고 Polygonym 은 Polygonum 과 Bistorta 로 분리 되었으며 Saxifraga 는 Saxifraga 와 Micranthes 로 분리되었지만 Melandrium 과 Silene 40 과 같은 다른 것들은 병합되었습니다.. 식물과의 이름이 변경되었습니다. 예를 들어, 벼과(Gramineae)는 이제 Poaceae(Poaceae)로 불리고 Scrophulariaceae는 Plantaginaceae와 Orobancheae를 제외하기 위해 다시 외접되었습니다 80 . 그런 다음 분류군을 다음과 같이 분류했습니다. DNA와 거대화석 또는 꽃가루에 의해 기록된 모든 동일한 속 범주 1, 과 수준 분류에 포함된 속을 포함하여 거대화석 또는 꽃가루에 의해 발견된 DNA에 의해 기록된 범주 2 속, DNA에 의해서만 기록된 범주 3 분류군, 거대 화석 또는 꽃가루에 의해서만 기록된 범주 4 분류군(소스 데이터 1).
계통 발생적 배치
우리는 가장 많은 수의 읽기가 할당되고 계통 발생을 구축하기에 충분한 수의 참조 시퀀스가 있는 고대 분류군 세트를 계통 발생적으로 배치하려고 했습니다. 이러한 분류군에는 Salix , Populus 및 Betula 식물 속 의 엽록체 게놈 과 코끼리과, 귀뚜라미과, Leporidae 과 뿐만 아니라 Capreolinae 및 Anserinae 아과의 미토콘드리아 게놈에 매핑된 읽기가 포함됩니다. 엽록체 게놈의 진화는 식물 미토콘드리아 게놈보다 다소 덜 안정적이지만 진화 속도가 더 빠르고 비재조합이므로 식물 미토콘드리아보다 분석에 더 많은 정보를 제공할 가능성이 높습니다. 81. 미토콘드리아 게놈과 마찬가지로 엽록체 게놈도 복제 수가 많기 때문에 많은 수의 퇴적 판독이 이에 매핑될 것으로 예상됩니다.
이러한 각 분류군에 대해 NCBI Genbank 82 에서 전체 엽록체 또는 전체 미토콘드리아 게놈 fasta 시퀀스의 대표 세트를 다운로드했으며 여기에는 최근 분기된 아웃그룹의 단일 대표 시퀀스가 포함됩니다. Betula 속의 경우 , PhyloNorway 데이터베이스 34 , 83 에서 3개의 엽록체 게놈도 포함 했습니다. 우리는 fasta 파일의 모든 모호한 염기를 N으로 변경했습니다. MAFFT 84 를 사용하여 이러한 각 참조 시퀀스 세트를 정렬하고 NCBI MSAViewer에서 여러 시퀀스 정렬을 검사하여 품질 85 를 확인했습니다.. MegaX 86 에서 d-루프를 제거하여 Leporidae, Cricetidae 및 Anserinae에 대한 매우 가변적인 제어 영역으로 인해 품질이 불충분한 미토콘드리아 정렬을 제거했습니다 .
BEAST suite 49 는 기본 매개변수와 함께 사용되어 Figtree의 Nexus에서 Newick 형식으로 변환된 참조 서열의 다중 서열 정렬(MSA)에서 분류군의 5개 세트 각각에 대한 울트라메트릭 계통발생수를 생성했습니다( https://github .com/rambaut/figtree ). 그런 다음 BioPython 87 의 Python 모듈 AlignIO에 여러 시퀀스 정렬을 전달하여 각 분류군의 참조 컨센서스 fasta 시퀀스를 생성했습니다. 또한 SNPSites 88 을 사용하여 각 MSA에서 vcf 파일을 생성했습니다. SNPSites는 누락된 데이터에 대해 다운스트림 분석에 필요한 형식과 약간 다른 형식을 출력하므로 맞춤형 R 스크립트를 사용하여 vcf 형식을 적절하게 수정했습니다. 우리는 또한 non-biallelic SNP를 필터링했습니다.
손상 필터링된 ngsLCA 출력에서 이러한 각 분류군 내 참조 시퀀스로 고유하게 분류되거나 분류 그룹 내부의 공통 조상에 할당된 모든 readID를 추출하고 seqtk( https://github.com/lh3/ )를 사용하여 이를 다시 fastq 파일로 변환했습니다. seqtk ). 모든 사이트 및 레이어의 읽기를 병합하여 각 분류군에 대한 단일 읽기 세트를 만들었습니다. 다음으로, 이러한 추출된 읽기는 각 분류군의 여러 시퀀스를 포함하는 참조 데이터베이스에 매핑되었으므로 출력 파일은 동일한 좌표계에 있지 않았습니다. 이 문제를 피하고 매핑 편향을 피하기 위해 각 판독 세트를 bwa 89 를 사용하여 해당 분류군에 대해 위에서 생성된 합의 시퀀스로 다시 매핑했습니다.고대 DNA 매개변수(bwa aln -n 0.001). 이러한 읽기를 bam 파일로 변환하고, 매핑되지 않은 읽기를 제거하고, samtools 90 을 사용하여 매핑 품질 > 25로 필터링했습니다 . 이것은 Salix , Populus , Betula , Elephantidae 및 Capreolinae 에 대해 각각 103,042, 39,306, 91,272, 182 및 129 읽기를 생성 했습니다.
다음으로 pathPhynder 62 를 사용했습니다. 이 알고리즘은 참조 패널에서 계통 발생에 대한 유익한 마커를 식별하고, 이러한 마커와 겹치는 고대 샘플의 SNP를 평가하고, 트리를 탐색하여 각각의 파생 및 조상 SNP에 따라 고대 샘플을 배치합니다. 나뭇가지. 충분히 높은 적용 범위로 인해 필터를 사용하지 않은 Betula , Salix 및 Populus 를 제외하고 탈아민으로 인한 오류를 피하기 위해 transversions-only 필터를 사용했습니다. 마지막으로 우리는 고대 샘플의 계통 발생적 배치를 결정하기 위해 각 분류군의 pathPhynder 출력을 조사했습니다(계통 발생적 배치에 대한 설명은 보충 정보 참조).
위에서 설명한 분석을 기반으로 Mammut 또는 마스토돈 속 내의 계통 발생적 배치를 추가로 조사했습니다. 다운스트림 결과에서 참조 바이어스 매핑을 피하기 위해 먼저 상기 분석에 사용된 모든 비교 미토콘드리아 게놈에서 합의 시퀀스를 구축하고 ngsLCA에서 Elephantidae로 확인된 읽기를 합의 시퀀스에 매핑했습니다. 컨센서스 시퀀스는 먼저 MAFFT 84 를 사용하여 관심 있는 모든 시퀀스를 정렬 하고 Geneious v2020.0.5( https://www.geneious.com )에서 다수결 규칙 컨센서스 기반을 취함으로써 구성되었습니다. 우리는 서열의 계통 발생적 배치에 대해 세 가지 분석을 수행했습니다. (1) 바다소( Dugong dugon) 아웃그룹으로, (2) 각 Elephantidae 종의 단일 대표에 대한 비교, 및 (3) 아웃그룹으로 아시아 코끼리 를 포함하여 발표된 모든 마스토돈 미토콘드리아 게놈에 대한 비교 .
이러한 각 분석에 대해 우리는 먼저 BEAST v1.10.4(참조 47)를 사용하여 새로운 참조 트리를 구축 하고 이전 에 설명한 pathPhynder 단계를 반복했습니다 . 낮은 적용 범위로 인해 전환에만 제한되지 않습니다.
마무트 아메리카눔
우리는 Elephantidae 미토콘드리아 참조 서열, GTR+G, 엄격한 시계, 출생-사망 대체 모델의 선택을 사용하여 우리 서열의 계통발생적 배치를 확인하고 20,000,000 단계마다 샘플링하여 20,000,000 런 동안 MCMC 체인을 실행했습니다. 수렴은 Tracer 91 v1.7.2 및 유효 샘플 크기(ESS) > 200을 사용하여 평가되었습니다. 회수된 마스토돈 미토겐의 대략적인 연령을 결정하기 위해 BEAST 47 v1.10.4로 분자 연대 분석을 수행했습니다. 우리는 최근 간행물 92 에서 입증된 바와 같이 마스토돈 미토겐의 연대를 측정할 때 두 가지 별도의 접근 방식을 사용했습니다 . 먼저, 우리는 방사성 탄소 연대 표본의 데이터 세트와 비교하여 시퀀스의 나이를 결정했습니다( n = 13) 만. 두 번째로, 우리는 이전에 결정된 분자 연대를 사용하여 분자 연대( n = 22)와 방사성 탄소 연대( n = 13) 표본을 모두 포함하는 시퀀스의 연대를 추정했습니다 92 . Karpinski et al.과 동일한 BEAST 매개 변수를 사용했습니다. 92 그리고 감마 분포(5% 분위수: 8.72 × 10 4 , 중앙값: 1.178 × 10 6 , 95% 분위수: 5.093 × 10 6 )로 샘플의 나이를 설정합니다.; 초기 값: 74,900; 모양: 1; 규모: 1,700,000). 요컨대 우리는 GTR+G4의 대체 모델, 엄격한 시계, 일정한 모집단 크기를 지정하고 Markov Chain Monte Carlo 체인을 50,000,000회 실행하여 50,000단계마다 샘플링했습니다. 실행의 수렴은 Tracer를 사용하여 다시 결정되었습니다.
분자 연대 측정 방법
이 섹션에서는 BEAST v1.10.4(참조 47 )를 사용하여 고대 자작나무( Betula ) 엽록체 게놈의 분자 연대를 설명 합니다. 원칙적으로 Betula , Populus 및 Salix 속은 충분히 높은 엽록체 게놈 적용 범위(평균 깊이는 각각 24.16×, 57.06× 및 27.04×이지만 이 적용 범위는 엽록체 게놈 전체에서 매우 고르지 않음)와 분자 분석을 시도하기에 충분한 참조 시퀀스를 가졌습니다. 이 샘플에 대한 데이트. 특히, 이것이 각 계통 발생 수목에서 발산 시간 추정치와 함께 최근에 발산된 외집단을 포함시킨 이유 중 하나입니다. 그러나 우리 Populus샘플은 pathPhynder 출력에서 일관되지 않은 배치에서 볼 수 있듯이 분명히 서로 다른 종의 혼합물을 포함하고 있습니다. 특히, Populus balsamifera 및 Populus trichocarpa 둘 다에 대한 다수의 지원 SNP가 있었고 , 위의 가지에는 지원 및 충돌하는 SNP가 모두 있었습니다. 또한 검사 결과 Salix 샘플에는 고대 또는 현대와 일치하지 않는 놀랍도록 많은 수의 개인 SNP가 포함되어 있으며 특히 다른 Salix 시퀀스 로 이어지는 계통 발생 수의 가장자리에 할당된 SNP의 수를 고려할 때 그렇습니다 . 이 불일치의 원인이 무엇인지 확실하지 않지만 Salix 샘플도 여러 Salix 를 포함하는 혼합 샘플 이라고 가정합니다.서로 다른 시기에 계통 발생 수의 동일한 배치 가지에서 갈라진 종. 이것은 많은 경우에 높은 비율로 존재하는 대체 및 참조 대립유전자를 모두 포함하는 읽기와 함께 일반적으로 혼합 샘플에서 나온 것으로 보이는 이러한 개인 SNP 사이트를 포함하는 모든 읽기를 살펴봄으로써 지원됩니다. 대안으로, 또는 잠재적으로 공동 병렬로, 이것은 Salix 93 에서 높은 수의 핵 색소체 DNA 서열(NUPT)의 결과일 수 있습니다 . 이 때문에 우리는 Betula 로만 계속했습니다 .
먼저 NCBI Genbank 저장소에서 아웃그룹으로 사용할 27개의 완전한 참조 Betula 엽록체 게놈 시퀀스와 단일 Alnus 엽록체 게놈 시퀀스를 다운로드하고 최근 연구에서 생성된 PhyloNorway 데이터베이스에서 3개의 Betula 엽록체 시퀀스로 이를 보완 했습니다 . 총 31개의 참조 서열. 엽록체 서열은 원형이기 때문에 다운로드한 서열은 정렬에 필요한 것과 항상 동일한 방향 또는 동일한 시작점에 있지 않을 수 있으므로 맞춤형 코드( https://github.com/miwipe/KapCopenhagen )를 사용했습니다.) 앵커 문자열을 사용하여 참조 시퀀스를 동일한 방향으로 회전하고 모두 동일한 지점에서 시작합니다. Maft 84 를 사용하여 이러한 변환된 참조 시퀀스의 MSA를 생성하고 Seqotron 94 및 NCBI MsaViewer 에서 육안으로 정렬 품질을 확인했습니다 . 다음 으로 다수결 규칙 합의 호출자인 Python 의 BioAlign 합의 기능 87 을 사용하여 이 MSA에서 합의 시퀀스를 호출했습니다. 참조 바이어스를 피하고 참조 MSA와 동일한 좌표에서 고대 Betula 샘플을 얻기 위해 이 합의 시퀀스를 사용하여 고대 Betula 읽기를 매핑합니다.
metaDMG 36 의 마지막 공통 조상 출력에서 Betula 의 분류학적 수준 이하로 고유하게 분류된 모든 단위, 사이트 및 수준에 대한 읽기 세트를 추출했으며, 모든 Betula 시퀀스 에 대해 최소 90% 이상의 시퀀스 유사성을 가지고 있습니다 . Seqtk 95 를 사용 합니다. 고대 DNA 매개변수(-o 2 -n 0.001 -t 20)와 함께 BWA 89 를 사용하여 합의된 Betula 엽록체 게놈에 대해 이러한 읽기 세트를 매핑 한 다음 매핑되지 않은 읽기를 제거하고 읽기 품질 ≥25에 대해 품질 필터링을 수행하고 다음을 사용하여 결과 bam 파일을 정렬했습니다. 샘툴즈 89. 분자 연대 측정을 위해 이러한 판독 세트를 단일 샘플로 간주하는 것이 적절하므로 결과 bam 파일을 samtools를 사용하여 하나의 샘플로 병합했습니다. 우리는 bcftools 89 를 사용하여 mpileup을 만들고 vcf 파일을 호출했습니다. 반수체에 대한 옵션을 사용하고 기본 호출 알고리즘을 비활성화하여 기본 기본 품질을 통과한 기본 품질을 통과한 기본에 대한 다수의 호출을 위해 호출을 참조 시퀀스 쪽으로 약간 편향시킬 수 있습니다. 13의 컷오프. 기본 정렬 품질을 사용하여 기본 옵션을 포함했습니다. 96, 우리는 일부 염기의 읽기 깊이를 크게 줄이고 인델 영역 주변의 가짜 SNP를 제거한 것을 발견했습니다. 마지막으로 단일 뉴클레오티드 변이만 포함하도록 vcf 파일을 필터링했습니다. 이러한 유형의 고대 환경 샘플에서 삽입 또는 삭제와 같은 다른 변이가 분자 연대 측정에 포함할 만큼 충분히 높은 신뢰도를 가지지 않는다고 믿기 때문입니다.
NCBI에서 가장 긴 Betula 참조 시퀀스인 MG386368.1에 대한 gff3 주석 파일을 다운로드했습니다 . 맞춤형 R 코드 97 을 사용하여 이 파일과 관련 fasta를 구문 분석하여 개별 사이트를 단백질 코딩 영역(gff3 파일에 표시된 상 및 가닥에 따라 코돈의 위치로 염기에 레이블을 지정함), RNA로 레이블을 지정했습니다. , 또는 코딩도 RNA도 아닙니다. 코딩 영역을 추출하고 Seqotron 94 에서 확인했습니다.R은 참조 서열과 고대 서열의 관련 위치 모두에서 단백질 정렬을 잘 번역했습니다(예: 미성숙 정지 코돈 없음). 최신 참조 서열의 코딩 영역이 고품질 단백질 정렬로 번역되었지만 깊이 컷오프가 없는 고대 서열의 관련 위치를 번역하면 조기 정지 코돈과 전반적으로 품질이 낮은 단백질 정렬이 발생합니다. 반면에 20의 깊이 컷오프를 사용하고 이 필터를 충족하지 못한 고대 시퀀스의 사이트를 N으로 대체하면 고품질 단백질 정렬(N 사이트 제외)을 볼 수 있습니다. 우리는 또한 합의와 다른 고대 시퀀스의 모든 위치를 조사했으며 의심스러운 영역(예:
다음으로 다중 시퀀스 정렬을 통해 이 주석을 구문 분석하여 BEAST 47 에 대한 파티션을 생성 했습니다. 각각에 얼마나 많은 다형성 및 전체 사이트가 있는지 확인한 후, 우리는 4개의 파티션을 사용하기로 결정했습니다. (1) 단백질 코딩 위치 1과 2에 속하는 사이트, (2) 코딩 위치 3, (3) RNA 또는 (4) 비 -코딩 및 비 RNA. 신뢰도가 높은 사이트인지 확인하기 위해 각 파티션에는 고대 시퀀스에서 깊이가 20 이상이고 다중 시퀀스 정렬에서 총 간격이 3개 미만인 위치만 포함되었습니다. 이것은 각각 11,668, 5,828, 2,690 및 29,538 사이트가 있는 파티션을 제공했습니다. 이 4개의 파티션을 사용하여 BEAST 47 을 실행했습니다.v1.10.4, 각 파티션에 대한 연결되지 않은 대체 모델 및 엄격한 클록, 각 파티션에 대해 서로 다른 상대적 속도. (이 데이터에는 단일 캘리브레이션에서 계보 간 속도 변화를 추론하기 위한 정보가 불충분했습니다.) 우리는 모든 참조 시퀀스에 0의 연령을 할당하고 루트 높이 48 에 대해 평균 61.1 Myr 및 표준 편차 1.633 Myr의 사전 정규 분포를 사용했습니다 . 표준 편차는 95% HPD를 z- 점수로 보수적으로 변환하여 얻었습니다. 전체 트리 사전에 대해 병합 모델을 선택했습니다. 고대 시퀀스의 나이는 Shapiro et al.의 전반적인 절차에 따라 추정되었습니다. (2011) 98. 이 알려지지 않은 날짜에 대한 사전 선택에 대한 민감도를 평가하기 위해 우리는 두 개의 다른 사전, 즉 어린 나이에 대한 감마 분포 메트릭(모양 = 1, 척도 = 1.7)을 사용했습니다. 범위 (0, 10 Myr)의 균일 사전. 우리는 또한 각 파티션 내에서 사이트 및 대체 유형 간의 두 가지 다른 비율 변동 모델, 즉 4개의 비율 범주가 있는 GTR+G와 데이터에서 추정된 기본 주파수, 그리고 훨씬 더 단순한 Jukes Cantor 모델(대체 간 변동이 없다고 가정함)을 비교했습니다. 유형이나 각 파티션 내의 사이트. 다른 모든 사전은 기본값으로 설정되었습니다. 요율 모델이나 사전 선택 모두 결과에 질적인 영향을 미치지 않았습니다(확장 데이터 그림 10). 우리는 또한 코딩 영역을 단독으로 실행했는데, 이는 올바르게 번역되었기 때문에 매우 신뢰할 수 있는 사이트이며 더 적은 수의 사이트를 사용할 때 예상되는 것과 같이 동일한 중앙값과 훨씬 더 큰 신뢰 구간을 제공한다는 것을 발견했습니다(확장 데이터 그림 10 ). 우리는 총 1억 반복 동안 각 Markov 체인 Monte Carlo를 실행했습니다. 처음 10%의 번인을 제거한 후 Tracer 91 v1.7.2에서 수렴을 확인했습니다(추적의 명백한 정상성 및 유효 샘플 크기 > 100을 갖는 모든 매개변수). 우리는 또한 TreeAnnotator 47 의 결과 MCC 트리가 pathPhynder 62 배치와 계통발생학적으로 동일하게 고대 시퀀스를 배치 했음을 확인했습니다 . 이는 확장 데이터 그림 9 에 나와 있습니다.. 우리의 주요 결과를 위해, 우리는 균일한 고대 시대 이전과 4개의 파티션 각각에 적용된 GTR+G 4 모델을 보고합니다. 관련 XML은 소스 데이터 3에 나와 있습니다. 95% HPD는 고대 Betula 엽록체 시퀀스 의 연령에 대해 (2.0172,0.6786)였으며 그림 2 에 표시된 대로 중간 추정치는 1.323 Myr입니다 .
|