|
저자 표시
자연 용량 599 , 페이지616–621 ( 2021 ) 이 기사 인용
추상적인
트랜스유라시아어(일본어, 한국어, 퉁구스어, 몽골어, 투르크어) 사용자의 기원과 초기 분산은 유라시아 인구 역사에서 가장 논란이 많은 문제 중 하나입니다 1 , 2 , 3 . 핵심 문제는 언어 분산, 농업 확장 및 인구 이동 간의 관계입니다 4 , 5. 여기서 우리는 통합된 관점에서 유전학, 고고학 및 언어학을 '삼각 측량'하여 이 문제를 해결합니다. 포괄적인 Transeurasian 농업 목축 및 기본 어휘를 포함하여 이러한 분야의 광범위한 데이터 세트를 보고합니다. 동북아시아의 255개 신석기-청동기 시대 유적지의 고고학 데이터베이스; 한국, 류큐 섬, 일본의 초기 곡물 농민의 고대 게놈 컬렉션은 이전에 발표된 동아시아 게놈을 보완합니다. 전통적인 '목축주의 가설'에 도전하기 6 , 7 , 8, 우리는 Transeurasian 언어의 공통 조상과 주요 분산이 초기 신석기 시대부터 동북아시아를 가로질러 이동한 최초의 농부로 거슬러 올라갈 수 있지만 이 공유된 유산이 청동기 시대 이후 광범위한 문화적 상호 작용에 의해 가려졌음을 보여줍니다. 세 가지 개별 분야에서 상당한 진전을 이뤘을 뿐만 아니라, 그들의 수렴 증거를 결합함으로써 우리는 트랜스유라시아어 사용자의 초기 확산이 농업에 의해 주도되었음을 보여줍니다.
기본
고대 DNA 시퀀싱의 최근 돌파구는 유라시아 전역의 인간, 언어 및 문화 확장 사이의 연결을 재고하게 만들었습니다. 그러나 서부 유라시아 9 , 10 , 11 에 비해 동부 유라시아는 아직 잘 이해되지 않고 있습니다. 내몽골, 황하강, 요강, 아무르강 유역, 러시아 극동, 한반도, 일본 열도를 아우르는 광대한 동북아시아는 최근 문헌에서 특히 과소 표현되고 있다. 유전학에 중점을 두거나 12 , 13 , 14 기존 데이터 세트 검토에 국한된 몇 가지 예외를 제외하면 4 동북아시아에 대한 진정한 학제간 접근은 거의 없습니다.
트랜스유라시아 언어('알타이어'라고도 함)의 언어적 관련성은 언어 선사 시대에서 가장 논란이 많은 문제 중 하나입니다. 트랜스유라시아어는 유럽과 북아시아에 걸쳐 있는 지리적으로 인접한 대규모 언어 그룹을 나타내며 논쟁의 여지가 없는 5개의 언어 계열인 Japonic, Koreanic, Tungusic, Mongolic 및 Turkic을 포함합니다(그림 1a ) . 이 다섯 그룹이 단일 공통 조상의 후손인지 여부에 대한 질문은 상속과 차용 지지자들 사이의 오랜 논쟁의 주제였습니다. 최근 평가에 따르면 이러한 언어 간의 많은 공통 속성이 실제로 차용 15 , 16 , 17그럼에도 불구하고 Transeurasian을 유효한 계보 그룹으로 분류하는 신뢰할 수 있는 핵심 증거가 있습니다 1 , 2 , 18 , 19 .
그림 1: 과거와 현재의 트랜스유라시아어 분포.
a , 이 연구에 포함된 98개의 트랜스유라시아 언어 변종의 지리적 분포. 현대 언어는 색상이 있는 표면으로, 역사적 다양성은 빨간색 점으로 표시됩니다. 범례는 확장 데이터 그림 1 을 참조하십시오 . b , 신석기 시대(빨간색)와 청동기 시대 이후(녹색)에 사용된 트랜스유라시아 조상 언어의 재구성된 위치. 국토 탐지에 대한 자세한 내용은 보충 데이터 4 를 참조하십시오 . 예상 시간 깊이는 보충 데이터 24 에 제시된 베이지안 추론을 기반으로 합니다 .
그러나 이 분류를 받아들이면 조상 트랜스유라시아 언어 공동체의 시간적 깊이, 위치, 문화적 정체성 및 분산 경로에 대한 새로운 질문이 생깁니다. 여기서 우리는 '농업 가설'을 제안함으로써 현재( BP) 6 , 7 , 8 이전 4천년에 동부 대초원에서 시작된 유목 확장과 함께 트랜스유라시아 언어의 주요 분산을 식별하는 전통적인 '목축주의 가설'에 도전합니다 . 이러한 분산은 '농업/언어 분산 가설' 5 , 20 , 21 범위 내에 있습니다.. 이러한 문제는 언어학을 훨씬 넘어서기 때문에 '삼각측량'이라는 단일 접근 방식으로 고고학과 유전학을 통합하여 문제를 해결합니다.
언어학
우리는 방언과 역사적 변종을 포함하여 98개의 트랜스유라시아 언어에 대한 254개의 기본 어휘 개념을 나타내는 3,193개의 동족 세트의 새로운 데이터 세트를 수집했습니다(보충 데이터 1 ). 우리는 베이지안 방법을 적용하여 Transeurasian 언어의 날짜별 계통 발생을 추론했습니다(보충 자료 24 ). 우리의 결과 는 가족의 Proto-Transeurasian 루트에 대해 9181BP (5595–12793 95% 가장 높은 확률 밀도(95% HPD)) 의 시간 깊이를 나타냅니다 . 6811 BP (4404–10166 95% HPD), 투르크어, 몽골어 및 퉁구스어의 통합인 Proto-Altaic의 경우; Mongolo-Tungusic의 경우 4491bp (2599–6373 95 % HPD); 일본-한국어의 경우 5458bp (3335–8024 95 % HPD)(그림 1b). 이 날짜는 주어진 언어군이 둘 이상의 기본 하위 그룹으로 초기 분해된 시간 깊이를 추정합니다.
우리는 공간에서 Transeurasian 언어의 확장을 모델링하기 위해 어휘 데이터 세트를 사용했습니다(보충 데이터 3 , 4 ). 우리는 사전통계학, 다양성 핫스팟 원리 및 문화적 재건과 같은 고전적 접근법을 보완하기 위해 베이지안 계통지리학을 적용했습니다 1 , 2 , 3 , 8 .
알타이 6 , 7 , 8 에서 황하 22, 대흥안산 23, 아무르 분지 24 에 이르는 이전에 제안된 고향과는 대조적으로, 우리는 초기 신석기 시대의 서요강 지역에서 트랜스유라시아 기원에 대한 지원을 찾습니다. 신석기 시대에 일차적으로 가족이 해체된 후 신석기 후기와 청동기 시대에 더 많은 흩어짐이 일어났습니다. 몽골어의 조상은 북쪽으로 몽골 고원까지 확장되었고, 원투르크어는 동쪽 대초원을 넘어 서쪽으로 이동했으며, 다른 가지들은 동쪽으로 이동했습니다. -한국을 넘어 일본 열도까지의 일본(그림 1b ).
원어의 재구성된 어휘에 나타난 농경어를 정성적으로 분석한 결과(보충자료 5 )), 우리는 특정 시간에 특정 지역의 조상 언어 커뮤니티에 대해 문화적으로 진단하는 항목을 추가로 식별했습니다. Transeurasian조어, Alta조조어, Mongolo-Tungus조어, Korean조어조어와 같이 신석기 시대에 분리된 공통 조상 언어는 경작과 관련된 상속된 단어의 작은 핵심을 반영합니다('field', 'sow'). , '심다', '자라다', '재배하다', '삽니다'); 기장('기장 종자', '수수 죽', '기장'); 식품 생산 및 보존('발효', '갈기', '으깨서 펄프', '양조'); 좌식 생활을 암시하는 야생 식품('호두', '도토리', '밤나무'); 직물 생산('바느질', '천 짜기', '베틀로 짜기', '방적', '천 자르기', '라미', '대마'); 유일한 길들여진 동물인 돼지와 개.
대조적으로, 투르크, 몽골, 퉁구스, 한국, 일본과 같은 청동기 시대에 분리된 개별 아족들은 쌀, 밀, 보리 재배와 관련된 새로운 생존 조건을 삽입했습니다. 낙농; 소, 양, 말과 같은 가축; 농업 또는 주방 도구; 실크와 같은 직물(보충 자료 5 ). 이 단어들은 다양한 트랜스유라시아어와 비트란스유라시아어를 사용하는 청동기 시대 인구 사이의 언어적 상호 작용의 결과로 차용한 것입니다.
요약하면, 트랜스유라시아 가족의 나이, 고향, 원래의 농업 어휘 및 접촉 프로필은 농업 가설을 뒷받침하고 목축가설을 배제합니다(보충 자료 5 ).
고고학
신석기 시대 동북아시아는 광범위한 식물 재배가 특징이었지만 25 곡물 재배는 여러 가축화 센터에서 확장되었으며 Transeurasian에게 가장 중요한 곳은 빗자루 수수 재배가 9000 BP 26 , 27 , 28 , 29 에 시작된 West Liao 분지였습니다. . 출판된 문헌에서 데이터를 추출하여 우리는 255개의 신석기 및 청동기 시대 유적지(보충 데이터 6 , 그림 2a )에 대해 172개의 고고학적 특징을 기록하고 북부 지역에서 직접적으로 탄소 14 연대가 지정된 초기 작물 유적(보충 데이터 9 ) 269개의 목록을 작성했습니다. 중국, 연해주, 한국, 일본.
그림 2: 고고학 데이터베이스에 포함된 사이트의 시공간 분포 및 클러스터링.
a , 신석기 시대(빨간색)와 청동기 시대(녹색)의 255개 지역의 지리적 분포. b , 유색 점은 시간과 공간에서 기장과 쌀의 확산을 나타내는 보충 자료 25 의 베이지안 분석에 따라 문화적 유사성에 따라 조사된 사이트를 클러스터링합니다 . 그림 2 의 고고학 유적지 분포는 그림 1 의 동시대 언어 분포보다 작습니다. 신석기 시대와 청동기 시대의 언어 하위 그룹의 초기 분산과 농업과 언어의 동쪽 확산 사이의 연결에 초점을 맞추기 때문입니다. 분산.
문화적 유사성에 따라 255개 사이트를 클러스터링하는 베이지안 분석(보충 데이터 25 ) 의 주요 결과는 그림 2b 에 시각화되어 있습니다 . 우리는 서요 분지에서 신석기 문화 집단을 발견하는데, 여기에서 기장 재배와 관련된 두 가지 분파가 분리됩니다. 이것은 기장 농업이 한국으로 5500 BP , 아무르를 거쳐 연해주로 5000 BP 30 , 31 확산되었다는 이전 연구 결과를 확인시켜 줍니다 .
우리의 분석은 한국의 무문 유적지와 일본의 야요이 유적지와 함께 서요 지역의 청동기 시대 유적지를 추가로 클러스터링합니다. 이것은 4천년 BP 동안 요동-산동 지역의 농업 패키지에 쌀과 밀이 어떻게 보충되었는지를 반영합니다. 이 작물은 초기 청동기 시대(3300-2800 BP ) 에 한반도에 전해졌다 가 일본에서 3000 BP 이후에 일본에 전해졌다 (그림 2b ).
인구 이동이 단일 고고학 문화와 연결되지는 않았지만 동북아시아의 신석기 시대 농업 확장은 경작 및 수확을 위한 석기 도구 및 섬유 기술32( 보충 자료 7 )과 같은 일부 진단 기능과 관련이 있습니다. 가축과 낙농업은 유라시아 서부에 신석기 시대가 전파되는 데 중요한 역할을 했지만, 개와 돼지를 제외하고 우리 데이터베이스는 청동기 시대 이전 동북아시아에서 동물 가축화에 대한 증거를 거의 보여주지 않습니다(보충 자료 6 ) . 농업과 인구 이동 사이의 연관성은 한국과 일본 서부 사이의 도자기, 석기, 가정 및 매장 건축 사이의 유사성에서 특히 분명합니다 33 .
이전 연구를 바탕으로 우리 연구에서 지역 전체에 기장 재배 도입과 관련된 인구 통계학적 변화에 대한 개요를 제공합니다(확장 데이터 그림 3 ). 정교한 논에 투자한 벼농사는 한곳에 머무르는 경향이 있어 추가 노동을 통해 인구 증가를 흡수하는 반면 기장 농민은 일반적으로 보다 확장적인 정착 패턴을 채택했습니다 34 . 신석기 시대 인구 밀도는 신석기 후기 35 , 36 의 인구 붕괴 이전에 동북아시아 전역에서 증가했습니다 . 청동기 시대는 중국, 한국, 일본에서 기하급수적인 인구 증가를 보였습니다.
유전학
우리는 아무르, 한국, 큐슈, 류큐에서 온 19명의 인증된 고대 개인에 대한 게놈 분석을 보고하고 9500년 사이에 동부 대초원, 서요, 아무르 및 황하 지역, 요동, 산동, 연해주 및 일본을 포괄하는 출판된 게놈과 결합했습니다. 및 300 BP (도 3a , 확장 데이터 도 4 , 보충 데이터 11 , 13 , 17 ). 우리는 그것들을 현재 149명의 유라시아 인구와 45명의 동아시아 인구의 주성분 분석(PCA)에 투영했습니다(확장 데이터 그림 5 – 8 ). 그림 3bJalainur는 Amur, Yangshao는 황하, Rokutsu는 Jomon 게놈을 나타내고 West Liao River의 Hongshan과 Upper Xiajiadian은 황하와 아무르 게놈으로 구성됩니다(qpAdm 혼합은 다음과 같습니다. Supplementary Data 16 의 다양한 동아시아 유전적 구성 요소 ).
그림 3: 고대 게놈의 시공간 분포 및 혼합.
, 시간과 공간에 위치한 고대 게놈. 자세한 범례는 확장 데이터 그림 4 를 참조하십시오 . b , 이 연구에서 20개의 주요 고대 인구에 대한 QpAdm 근접 혼합 모델링. x 축은 y 축의 대상 인구에 대한 조상 비율 추정치를 보여 줍니다 . 오차 막대는 5cM 블록 잭나이핑으로 추정되는 ±1sem 범위를 나타냅니다.
동시대 퉁구스어와 아무르어의 니브크어 화자는 밀집된 클러스터를 형성합니다 13 (확장 데이터 그림 5 ). Baikal, Primorye 및 남동부 대초원의 신석기 수렵 채집인과 West Liao 및 Amur의 농부는 모두 이 클러스터 내에서 프로젝트를 수행합니다(확장 데이터 그림 8 - 10 ).
후기 신석기 시대 안강시(보충 자료 12 )는 아무르 유사 조상의 비율이 높은 반면 서요 신석기 기장 농부들은 시간이 지남에 따라 황하 게놈으로 점진적으로 이동하면서 상당한 비율의 아무르 유사 조상을 보여 줍니다 . 8 – 10 , 그림 3b ). 서부 랴오 강에는 초기 신석기 시대 게놈이 부족하지만, 따라서 아무르와 같은 조상은 바이칼, 아무르, 연해주, 남동부 대초원 및 서부를 망라하는 토착 신석기 시대 이전(또는 후기 구석기 시대) 수렵 채집인의 원래 유전적 프로필을 나타낼 가능성이 있습니다. Liao는 이 지역의 초기 농민들에게 계속됩니다. 이것은 최근의 유전 연구와 모순됩니다 13, 몽골과 아무르의 고대 게놈에 황하 영향이 없다는 결론은 Transeurasian 언어 가족의 West Liao 유전 상관 관계를 지원하지 않습니다.
PCA(Extended Data Figs. 8 – 10 )는 청동기에서 중세로 증가하는 서부 유라시아의 광범위한 유전자 흐름과 함께 높은 아무르 유사 조상을 포함하는 몽골의 신석기 시대 개인에 대한 일반적인 경향을 보여줍니다 37 . Turkic을 사용하는 Xiongnu 38 , Old Uyghur 및 Türk가 극도로 흩어져있는 반면 몽골어를 사용하는 39 철기 시대 Xianbei는 고대 및 중세의 Shiwei, Rouran, Khitan 및 Middle Mongolian Khanate보다 아무르 성단에 더 가깝습니다.
아무르 관련 조상은 일본어와 한국어 사용자까지 추적할 수 있기 때문에 13 모든 트랜스유라시아어 사용자에게 공통적인 원래의 유전적 구성 요소인 것으로 보입니다. 한국의 고대 게놈을 분석하여(보충 자료 12 ) 조몬 조상이 6000 BP 까지 반도에 존재했음을 발견했습니다 (그림 3b , 보충 자료 13 ).
근위 qpAdm 모델링(보충 데이터 13 )은 신석기 시대 안도가 완전히 홍산과 관련된 조상에서 파생될 수 있는 반면, 연대도와 창항은 홍산 조상의 비율이 높은 조몬의 혼합으로 모델링될 수 있음을 시사합니다. (보충 자료 16 , 그림 3b ). 한국 남쪽 해안에 위치한 욕치도는 거의 95%가 조몬 조상을 포함하고 있습니다. 우리의 유전적 분석 자체가 청동기 시대 태중리의 가능한 동아시아 조상을 구별할 수는 없지만, 주어진 청동기 시대 날짜를 고려할 때 상부 샤자디안으로 가장 잘 모델링할 수 있습니다. 가능한 소량의 조몬 혼합물은 통계적으로 유의하지 않습니다( P = 0.228; 보충 자료 16). 따라서 우리는 신석기 시대 한국인(0-95%)에서 조몬 조상의 이질적인 존재와 시간이 지남에 따라 궁극적으로 사라지는 것을 관찰합니다. 태중리에서 중요한 조몬 요소가 없다는 것은 현재 한국인과 연결된 조몬 조상이 감지되지 않는 초기 인구가 벼농사와 관련하여 한반도로 이주했으며 신석기 인구를 일부 조몬 혼합물로 대체했음을 나타냅니다. 제한된 샘플 크기와 적용 범위로 인해 이 가설을 테스트할 해상도가 없습니다. 따라서 우리는 한국으로의 농업 확산을 아무르와 황하 유전자 흐름의 다른 물결과 연관시킵니다.
Yayoi 농민의 게놈을 분석한 결과(보충 자료 12 ) 태중니처럼 그들은 청동기 시대 상부 Xiajiadian 조상과 혼합된 토착 Jomon 조상으로 모델링될 수 있음을 발견했습니다. 우리의 결과는 청동기 시대에 한국에서 일본으로의 대규모 이주를 뒷받침합니다.
Miyako Island의 Nagabaka 게놈(보충 데이터 12 )은 우리가 아는 한 류큐의 고대 게놈 전체 데이터를 나타냅니다. Holocene 인구가 대만에서 남부 류큐에 도달했다는 이전 연구 결과와 달리 , 우리의 결과는 선사 시대 Nagabaka 인구가 북쪽의 Jomon 문화에서 유래했음을 시사합니다(확장 데이터 그림 7 ). 근대 초기 이전에 조몬에서 야요이와 같은 조상으로의 유전적 전환은 이 지역에 농업과 류큐어가 늦게 도착했음을 반영합니다.
논의
언어학적, 고고학적, 유전적 증거의 삼각측량은 트랜스유라시아어의 기원이 신석기 시대 동북아시아의 기장 재배 시작과 초기 아무르 유전자 풀로 거슬러 올라갈 수 있음을 보여줍니다. 이러한 언어의 확산은 농업과 유전자의 분산을 반영하는 두 가지 주요 단계를 포함합니다(그림 4). Transeurasian 가족의 주요 분할로 대표되는 첫 번째 단계는 아무르 관련 유전자와 관련된 조 농부가 West Liao River에서 인접 지역으로 퍼진 초기-중기 신석기 시대로 거슬러 올라갑니다. 두 번째 단계는 5개의 딸 가지 사이의 언어적 접촉으로 대표되며 신석기 후기, 청동기 및 철기 시대로 거슬러 올라갑니다. 당시 상당한 아무르 조상을 가진 기장 농부들이 점차 황하, 서부 유라시아 및 조몬 인구와 혼합되고 쌀, 서부 유라시아가 추가되었습니다. 농작물과 목축업을 농업 패키지로.
그림 4: 동북아시아의 언어, 농업 및 유전적 확장의 통합.
아무르 혈통은 빨간색, 황하 혈통은 녹색, 조몬 혈통은 파란색으로 표시됩니다. 빨간색 화살표는 신석기 시대에 기장 농부들이 동쪽으로 이주하여 표시된 지역에 한국어와 퉁구스어를 전파했음을 보여줍니다. 녹색 화살표는 신석기 후기와 청동기 시대에 벼농사가 통합되어 한국에서 일본으로 일본어가 유입되었음을 나타냅니다.
시공간 및 생존 패턴을 결합하여 세 가지 분야 간의 명확한 연결을 찾습니다(보충 데이터 26 ). 9천년기 BP 경에 서랴오 지역에서 조 경작이 시작된 것은 상당한 아무르 관련 조상과 연관될 수 있으며 조상 트랜스유라시아 언어 공동체와 시간과 공간이 겹칩니다. 8000 BP 로 추정되는 중국-티베트 가족 41,42 과 황하 중상류의 신석기 농부 13,14 사이 의 최근 연관성에 따라, 우리의 결과는 동북아시아의 기장 재배의 두 센터를 황하의 중국-티베트어와 서랴오 강의 트랜스유라시아어의 두 가지 주요 어족의 기원과 연관시킵니다. 조상의 트랜스유라시아 언어와 유전자에서 황하 영향에 대한 증거가 부족하다는 것은 고고학에서 제안된 기장 재배의 다중 중심적 기원과 일치합니다 28 .
9~7천년 BP 의 기장 작물화 초기 단계 에는 인구 증가가 동반되어(확장 데이터 그림 3 ) West Liao 지역에서 환경적으로 또는 사회적으로 분리된 하위 그룹이 형성되고 알타이어 사용자와 일본어 사용자 간의 연결이 끊깁니다. -한국어.
6000년대 중반경에 이들 농부 중 일부는 황해를 따라 한국으로, 북동쪽으로 연해주로 이주하기 시작하여 한국어와 퉁구스어를 이 지역에 도입하고 서요 지역에서 추가적인 아무르 조상을 연해주로 가져왔습니다. 그리고 아무르-황하의 혼합 혈통이 한국에 왔습니다. 우리가 새로 분석한 한국인 게놈은 일본 이외 지역에서 조몬 관련 조상의 존재 및 혼합을 증언한다는 점에서 주목할 만합니다.
후기 청동기 시대에는 유라시아 대초원 전역에서 광범위한 문화 교류가 이루어졌으며, 그 결과 서부 유라시아 유전적 혈통을 가진 서랴오 지역과 동부 대초원의 인구가 혼합되었습니다. 언어학적으로 이러한 상호작용은 특히 밀과 보리 경작, 방목, 낙농, 말 착취와 관련하여 원몽골어와 원투르크어 화자들이 차용한 농목축어 어휘에 반영되어 있습니다.
약 3300 BP , Liaodong–Shandong 지역의 농부들이 한반도로 이주하여 기장 농업에 쌀, 보리 및 밀을 추가했습니다. 이 이동은 한국의 청동기 시대 샘플에서 Upper Xiajiadian으로 모델링된 유전적 요소와 일치하며 일본어와 한국어 사이의 초기 차용에 반영됩니다. 고고학적으로 그것은 특히 Upper Xiadiajian 물질 문화에 국한되지 않고 더 큰 Liaodong–Shandong 지역의 농업과 관련될 수 있습니다.
세 번째 밀레니엄 BP 에서 이 농업 패키지는 큐슈로 전해져 본격적인 농업으로의 전환, 조몬에서 야요이 조상으로의 유전적 전환, 일본어로의 언어 전환을 촉발했습니다. 남부 류큐의 나가바카에서 고유한 샘플을 추가하여 농경/언어 분산을 트랜스유라시아 세계의 가장자리로 추적했습니다. Jomon 조상이 미야코 섬까지 남쪽으로 뻗어 있음을 보여주는 결과는 대만의 Austronesian 인구에 의한 북쪽 확장에 대한 이전 가정과 모순됩니다. 한국 욕치도에서 발견된 조몬 프로파일과 함께 우리의 결과는 조몬 게놈과 물질 문화가 항상 겹치는 것은 아니라는 것을 보여줍니다.
고대 DNA의 새로운 증거를 발전시킴으로써 우리 연구는 일본과 한국 인구가 서요강 조상을 가지고 있다는 최근 발견을 확인하는 반면, 트랜스유라시아 어족의 유전적 상관관계가 없다는 이전의 주장과 모순됩니다 13 .
일부 이전 연구에서는 트랜스유라시아 지역을 농업에 적합한 지역을 넘어선 것으로 간주했지만 20 , 우리의 연구는 농업/언어 분산 가설이 유라시아 인구 분산을 이해하는 데 중요한 모델로 남아 있음을 확인했습니다 21 . 언어학, 고고학, 유전학의 삼각 측량은 목축과 농업 가설 사이의 경쟁을 해결하고 트랜스유라시아 화자의 초기 확산이 농업에 의해 주도되었다는 결론을 내립니다.
행동 양식
언어학베이지안 계통발생학
현장 조사와 사전 검색을 결합하여 현대 및 역사적 변종을 포함하여 98개의 트랜스유라시아 언어에 대한 254개의 기본 어휘 개념을 나타내는 3,193개의 데이터 포인트를 포함하는 비교 데이터 세트를 수집했습니다(보충 데이터 1 ) . 이러한 개념은 Leipzig–Jakarta 200(참조 43 )과 Jena 200(참조 44 ) 목록(보충 자료 2 )의 병합을 기반으로 합니다. 포함된 투르크어 및 퉁구스어 기본 어휘는 최근에 게시된 데이터 세트 45 , 46 의 개정판을 기반으로 합니다 . 동족 코딩은 보충 자료 2 에 제시된 Transeurasian 언어에 걸친 기본 어휘 어원 및 음성 대응 목록에 의해 지원됩니다 .
우리는 이진 데이터로 인코딩된 동족을 사용하여 베이지안 계통발생학적 분석을 수행했습니다 47 . 적어도 하나의 동족이 존재하도록 데이터가 수집되었기 때문에, 데이터는 모두 0인 사이트를 포함하지 않는 것으로 확인되었습니다. 이를 충족시키기 위해 확인 보정이 적용되었습니다 47 .
우리는 트리의 가지를 따라 동족의 진화 과정을 지배하는 다음 대체 모델을 고려했습니다. 일정한 돌연변이 비율을 가정하는 연속 시간 마르코프 체인(CTMC) 느리고 빠른 속도와 이 두 상태 사이에서 전환하는 모델을 가정하는 covariion; 동족은 한 번만 나타날 수 있지만 여러 번 손실될 수 있다는 Dollo 원칙에 기반한 유사 Dollo 공변량 모델. CTMC 및 공변량 모델 (47) 및 유사 Dollo 공변량 모델 (48) 에 대한 자세한 설명은 문헌에서 확인할 수 있습니다. 모든 모델에 대해 각 의미 클래스에는 서로 다른 단어의 진화 속도 간의 차이를 캡처하기 위한 고유한 상대 속도가 있다고 가정합니다.
언어는 평균적으로 일정한 속도로 진화하지만, 우리는 나무의 가지 사이에 상당한 속도 변화가 있을 수 있음을 발견했습니다 47 , 48 . 이러한 변동은 레이트가 대수 정규 분포라고 가정할 때 비상관된 완화된 클록 (49)을 사용하여 포착될 수 있다 .
출생 사망 모델은 언어 생성의 생성 과정을 설명하는 데 사용됩니다. 데이터에는 현재 언어의 조상일 수 있는 고대 언어가 포함되어 있으므로 트리에 조상 노드가 있도록 허용합니다. 이러한 조상 노드를 허용 하는 화석화된 출생 사망 모델 (50) 이 나무에서 우선적으로 사용됩니다. 언어 가족 노드 연령은 사전 연령(JAPONIC 2100 BP ± 175, Korean 800 BP ± 175, Turkic 2100 BP ± 175, Mongolic 750 BP ± 50, Tungusic 1900 BP ± 275) 에 의해 알려졌습니다 . 이러한 보정은 언어 문헌에서 제안된 연대순 추정에 의해 지원됩니다(보충 데이터 18). 우리는 이러한 노드 연령 사전이 루트 연령 분포의 불확실성을 약간 줄이는 데 도움이 된다는 것을 발견했습니다.
우리는 중첩된 샘플링 51 (보충 데이터 18 )을 사용하여 한계 우도를 추정하여 서로 다른 모델의 적합도를 비교했으며 , 편안한 시계가 있는 의사 Dollo 공변량 모델이 가장 적합하고 편안한 시계가 있는 공변량이 그 다음으로 가장 적합하다고 결론지었습니다. 두 모델 모두 호환 가능한 시간 추정치를 생성하지만 공변량 추정치는 불확실성이 더 큰 경향이 있습니다(즉, 95% HPD 간격이 더 큼). 완화된 시계를 사용하는 CTMC 모델의 시간 추정치는 여전히 호환 가능하지만 더 넓고 평균이 더 높은 경향이 있습니다.
모든 사후 추정은 MCMC(adaptive coupled Markov chain Monte Carlo) 53를 사용하여 BEAST v.2.652을 사용하여 수행되었습니다 . 이러한 모델을 실행하는 데 사용되는 모델, 사전, 하이퍼프라이어 및 설정의 자세한 사양은 BEAST XML 파일(보충 데이터 19 )에서 찾을 수 있습니다. 베이지안 분석의 결과는 Transeurasian 언어의 날짜가 지정된 계통 발생 트리로 시각화됩니다(보충 데이터 24 ).
베이지안 물리학
우리는 유라시아를 통한 사람들의 흩어짐이 무작위 보행으로 설명될 수 있다고 가정했기 때문에 구체 54 에서의 확산에 의해 가장 잘 포착됩니다 . 이러한 모델에 의한 어원 찾기의 불확실성에 대한 인상을 얻기 위해 어휘 분석의 사후 트리 세트를 사용하여 사후 분석을 수행했습니다. 팁에 포인트 위치를 할당하고 MCMC를 통해 지리적 매개 변수를 추정하면서 후방에서 무작위로 트리를 샘플링했습니다. 이 상대적으로 제한된 설정에서도 루트 위치의 불확실성으로 인해 다른 지리적 기원 가설을 구별할 수 없습니다. 분석 결과는 지도에 표시됩니다(보충 자료 3 ). Bayesian phylogeography는 많은 제한과 싸워야 하기 때문에 55 , 56, 언어 고생물학 및 다양성 핫스팟 원칙과 같은 다른 고향 탐지 방법으로 보완하여 Transeurasian 가족의 뿌리와 노드의 고향에 대한 균형 잡힌 위치에 도달했습니다 (보충 데이터 4 ) .
언어 고생물학
우리는 각 Transeurasian 아과에 대한 비교 농경 어휘를 편집했습니다 : Turkic (보충 데이터 5a ), Mongolic (보충 데이터 5b ), Tungusic (보충 데이터 5c ), Koreanic (보충 데이터 5d ) 및 Japonic (보충 데이터 5e ). 우리는 후대에 사용 가능한 데이터의 증거에 대해 언어의 입증되지 않은 조상 상태를 추론하는 절차인 언어 재구성을 해당 단어에 적용했습니다(보충 데이터 5 ) .
상속된 서신 세트와 차용된 서신 세트를 구별하기 위해 보충 자료 5 에 지정된 대로 관련 단어의 음운론, 의미론, 형태 및 분포를 기반으로 하는 표준 기준을 사용했습니다 . 데이터 세트를 차용된 생계 어휘와 상속된 어휘로 나누어 각 범주에 대해 고유한 시공간적 및 문화적 패턴을 결정했습니다(보충 데이터 5 ).
우리는 언어학적 재구성을 이 단어를 사용했던 고대 언어 공동체의 문화에 대한 고고학 정보와 연관시켜 인간 선사시대를 연구할 수 있게 해주는 역사적 비교 방법인 생존 어휘에 언어 고생물학을 적용했습니다. 이런 식으로 우리는 신석기 시대와 청동기 시대(보충 자료 5 )에 다른 트랜스유라시아 원시 언어의 화자가 사용할 수 있는 생존 전략에 대한 추론을 도출하고 관련된 고대 언어 공동체의 고향에 대한 그럴듯한 위치를 식별했습니다(보충 자료 4 ).
다양성 핫스팟 원칙
관련된 고대 음성 커뮤니티의 위치를 추정하기 위해 베이지안 물리학과 언어 고생물학을 다양성 핫스팟 원리와 결합했습니다. 이 원칙은 모국이 어족의 가장 깊은 하위 그룹과 관련하여 가장 큰 다양성에 가장 가깝다는 가정을 기반으로 합니다. 우리는 지도에서 이러한 영역을 찾아 특정 원시 언어가 다양화되기 시작한 영역의 근사치로 사용했습니다(보충 데이터 4 ). 이 방법은 여기에서 논의된 고향 위치에 대한 다른 기술과 함께 특정 제한 사항(보충 데이터 4 ) 과 싸워야 하지만 고대 음성 커뮤니티의 위치를 합리적으로 강력하게 추정할 수 있습니다.
고고학고고학 데이터베이스
우리는 서요강 유역(36), 아무르(지린, 헤이룽장 및 내륙 요녕)(32), 연해주(4), 요동 반도(37 ), 동부 대초원(1), 산둥 반도(4), 황하 유역(2), 한반도(58) 및 일본 열도(85).
여러 주요 문화 단계가 있는 사이트는 별도로 점수를 매겼습니다. 유적지는 8400-1700 BP 로 거슬러 올라가며 중국 북동부의 초기 신석기에서 청동기 시대, 연해주의 중기 신석기 시대 Zaisanovka 문화, 한국의 중기 신석기 시대 출문 및 청동기 시대 무문 문화, 후기 신석기 시대-청동기 시대를 포함합니다. 서일본의 마지막 조몬 문화와 야요이 문화. 점수가 매겨진 문화적 특성의 범주는 도자기(70), 석기(38), 건물(9), 식물 및 동물 유적(26), 조개 및 뼈 공예품(17) 및 매장(12)으로 구성되었습니다. 스코어링된 기능의 정의는 보충 데이터 6 (시트 2) 에서 찾을 수 있으며 스코어링 방법에 대한 추가 설명은 보충 데이터 7 에서 찾을 수 있습니다. . 게시된 사이트 보고서 또는 기타 문헌에 따라 모든 기능이 있음(1) 또는 없음(0)으로 점수가 매겨졌습니다.
이 데이터베이스는 특히 동북아시아의 농업 시스템 확산과 관련하여 시간 경과에 따른 신석기 및 청동기 시대 유물의 분포 변화를 분석하는 데 사용되었습니다(보충 자료 7 ) .
또한 고고학 데이터베이스의 문화 데이터는 베이지안 계통 발생 방법을 사용하여 분석되었습니다. 고고학적 데이터 57 , 일부 인색 기반 58 , 기타 거리 기반 59 에 대한 많은 양의 계통 발생 연구가 있습니다.. 베이지안 접근 방식의 이점은 모델 기반이며, 확률 이론에 건전한 공식 수학적 기초가 있어 모든 추정치 주변의 불확실성을 추정할 수 있고 다양한 소스의 정보를 단일 분석(동족 및 지리적 데이터와 같은) 기반으로 통합할 수 있다는 것입니다. 확률론에 대해. BEAST는 뿌리가 없는 나무를 대상으로 하는 다른 베이지안 패키지와 차별화되는 시간 추정치의 불확실성과 뿌리가 있는 시간 나무를 추론하는 것을 특별히 목표로 합니다. 또한 BEAST는 현재 다른 패키지에서 사용할 수 없는 모델을 지원하므로 이 패키지를 사용합니다.
문화 데이터는 이진 정렬로 인코딩되며 어휘 데이터와 동일한 대체 및 시계 모델을 적용했습니다. 이완된 시계를 가진 pseudo Dollo 모델이 데이터에 가장 적합합니다(보충 데이터 20 ). 완화된 시계의 변동 계수가 상당한 양의 변동을 나타내는 1을 초과했기 때문에 시간 추정치에 약간만 영향을 미치는 표준 편차를 1로 제한하여 분석을 실행했습니다.
많은 수의 샘플링 날짜와 누락된 문화 수에 대한 불확실성으로 인해 사전에 화석화된 출생 사망을 적용하기 어려웠기 때문에 대신 유연한 베이지안 스카이라인 플롯을 선택했습니다 60 . 시간 정보는 고고학적 발견의 샘플링 날짜를 기반으로 합니다. 이러한 결과의 연대가 불확실하기 때문에 팁 날짜는 MCMC 동안 이러한 간격으로 균일하게 샘플링되었습니다. 이전의 고고학 연구 61 , 62 , 63 에 따라 우리는 'Xinglongwa–Zhabaogou–Hongshan' 및 'Yabuli–Primorye' 분기군을 단계통군으로 제한했습니다(보충 자료 8 ). 모든 분석은 BEAST v.2.6 52 에서 적응 결합 MCMC 53를 사용하여 수행되었습니다.. 모델, 우선 순위, 하이퍼 우선 순위 및 설정에 대한 자세한 내용은 BEAST XML(보충 데이터 21 )에서 찾을 수 있습니다. 베이지안 분석의 결과는 동북아시아의 고고학 문화의 계통발생수(보충 자료 25 )로 시각화되고 보충 자료 8 에서 해석됩니다 .
고고학 데이터베이스
고고 학적 특징 데이터베이스 외에도 방사성 탄소로 직접 연대를 측정 한 동북아시아 각 지역의 가장 초기 농작물 목록을 작성했습니다 (보충 자료 9 ). 이 목록은 269개의 샘플로 구성되어 있습니다(중국, 82, Primorye, 12, 한국, 31, 일본(류큐 제외), 120, 류큐 제도, 24). 이 데이터베이스의 방사성 탄소 연대는 OxCal v.4.4를 사용하여 재보정되었습니다. 우리는 커널 밀도 매핑을 사용하여 시간 경과에 따라 이 데이터베이스에서 곡물의 확산을 플로팅했습니다. 보충 데이터 7 ). 우리의 데이터베이스는 동물 유적 64 , 65 , 고인돌 66 및 스핀들 나선 67 에 대해 공개된 데이터 세트로 보완되었습니다 .
유전학실험실 절차
DNA 추출 및 라이브러리 준비를 포함한 고대 DNA 습식 실험실 작업은 Max Planck Institute for the Science of Human History(MPI-SHH)의 전용 고대 DNA 클린룸 시설과 길림 대학교의 고대 DNA 실험실에서 수행되었습니다. 프로토콜 68. 이중 가닥 라이브러리는 P5 및 P7 Illumina 어댑터 모두에서 8-mer 인덱스 시퀀스로 구축되었습니다. 길림성을 특징으로 하는 중국 출신의 4명의 개인은 적절한 적용 범위를 얻기 위해 150bp 페어드 엔드 시퀀싱 디자인의 Illumina HiSeq X10 기기에서 직접 샷건 시퀀싱되었습니다. 한국과 일본에서 온 33명의 개인을 위한 83개의 이중 가닥 라이브러리를 생성하고 MPI-SHH에서 샷건 시퀀싱 또는 약 120만 유익한 핵 단일 염기 다형성(SNP)에서 불용액 캡처로 특성화했습니다. 해당 라이브러리의 보존에 대한 초기 스크리닝 후, 샘플에서 더 많은 내인성 DNA를 검색하기 위해 추가로 108개의 단일 가닥 라이브러리가 구축되었으며, 다시 해당 라이브러리는 직접 샷건 시퀀싱되고 약 1에서 용액 내 캡처되었습니다. 17 ) 제조업체의 프로토콜에 따라 Illumina HiSeq 4000 플랫폼에서 시퀀싱됩니다.
시퀀스 데이터 처리
원시 시퀀싱 읽기는 EAGER v.1.92.55 프로그램 69를 사용하여 자동화된 작업 흐름에 의해 처리되었습니다 . Illumina 어댑터 시퀀스는 시퀀싱 데이터에서 트리밍되었고 중첩 쌍은 AdapterRemoval v.2.2.0 70 과 병합되었습니다 . BWA v.0.7.12 71 를 사용하여 인간 참조 게놈(hs37d5; 미끼 서열이 있는 GRCh37)에 최소 30 bp의 병합된 읽기를 매핑했습니다 . DeDup v.0.12.2 60 에 의해 PCR 중복을 제거했습니다 . genotyping에 대한 사후 DNA 손상의 영향을 최소화하기 위해 우리는 bamUtils v.1.0.13 72의 trimbam 기능을 사용하여 판독당 양쪽 끝에서 nonUDG 라이브러리의 경우 2bp, half-UDG 라이브러리의 경우 10bp를 마스킹했습니다 .. 기본 품질(Phred-scale quality)과 매핑 품질(Phred-scale mapping quality)이 모두 30 이상인 정리된 읽기는 mpileup 기능이 있는 SAMtools 1.3 60 에 의해 쌓였습니다. 무작위 반수체 호출 모드 에서 '1240k' 패널 73 , 74 의 SNP에 대해 pileupCaller 프로그램( https://github.com/stschiff/sequenceTools ) 을 사용하여 pseudo-diploid 유전자형을 호출했습니다. C/T 및 G/A SNP의 경우 마스킹된 BAM 파일을 사용했습니다. 나머지는 마스킹되지 않은 원본 BAM 파일을 사용했습니다.
참조 데이터세트
우리는 Affymetrix HumanOrigins Axiom Genome-wide Human Origins 1 어레이('HumanOrigins'; 593,124 상염색체 SNP) 75, '1240k' 패널 73 , 및 ' 일루미나' 데이터세트 76 . 우리는 Simons Genome Diversity Panel 77을 추가 하고 고대 게놈을 발표함으로써 이러한 데이터 세트를 보강했습니다(보충 데이터 11 ).
고대 DNA 인증
새로 공개된 한국과 일본의 고대 게놈의 인증을 확인하기 위해 여러 기준을 적용했습니다. 먼저 mapDamage v.2.0.6 78을 사용하여 고대 DNA에 대한 사후 화학적 변형 특성을 특성화했습니다 . 둘째, Schmutzi v.1.5.1 79를 사용하여 모든 개인의 미토콘드리아 오염률을 추정했습니다 . 셋째, ANGSD v.0.910 80 에 구현된 X 염색체 데이터를 기반으로 남성의 핵 게놈 오염률을 측정했습니다.. 수컷은 X 염색체의 단일 사본만 가지고 있기 때문에 시퀀싱 오류 수준을 넘어 동일한 다형성 위치에 정렬된 염기 간의 불일치는 오염의 증거로 간주됩니다. 넷째, PMD 점수가 3 이상인 PMDtools 81 에 구현된 단일 가닥 라이브러리에 대한 손상 제한 읽기 및 사용 가능한 모든 읽기로 서 유라시아 오염 가능성을 평가하고 모든 읽기 및 손상된 유라시아 PCA에서의 위치를 비교했습니다. 혼자 읽습니다. 다섯째, Sintashta_MLBA 또는 LBK_EN과 같은 서부 유라시아 특성 그룹을 소스로 사용하여 서부 유라시아 오염을 추가로 특성화하기 위해 개인당 qpAdm 74를 적용했습니다 (자세한 내용은 보충 데이터 17 , 22 참조 ).
인구 구조 분석
우리는 'HumanOrigins' 데이터세트와 'lsqproject: YES' 및 'shrinkmode: YES' 옵션이 있는 '1240kIllumina' 데이터세트의 현재 유라시아인 2,077명 세트를 사용하여 smartpca v.16000 82로 PCA를 수행 했습니다 . 우리는 아웃그룹-f 3 통계 83 , 84를 사용하여 아프리카 아웃그룹에서 분기한 이후 두 인구 사이의 유전적 친화도를 측정했습니다. admixtools 31 의 'f4mode: YES' 기능으로 f 4 통계를 계산했습니다 . f 3 및 f 4 통계는 모두 admixtools 패키지의 qp3Pop v.435 및 qpDstat v.755를 사용하여 계산되었습니다.
유전적 성감별과 일부모 하플로그룹 할당
우리는 상염색체에 대한 X 및 Y 염색체 범위의 비율을 비교하여 고대 샘플의 분자 성별을 결정했습니다 85 . 여성의 경우 X 대 상염색체 적용 범위의 대략적인 비율과 Y 비율 0이 예상됩니다. 남성의 경우 상염색체보다 X 및 Y에 대한 적용 범위의 약 절반을 예상합니다.
qpAdm을 사용한 혼합물 모델링
우리는 이 연구에서 admixtools v.5.1 패키지 74의 qpWave/qpAdm 프레임워크(qpWave v.410 및 qpAdm v.810)를 사용하여 고대 개인을 모델링 했습니다 . 우리는 아웃그룹('OG')으로 '1240k' 데이터세트에서 다음 7개 인구를 사용했습니다: Mbuti, Onge, Iran_N, Villabruna, Karitiana, Naxi 및 Funadomari Jomon. 이 세트에는 아프리카 아웃그룹(Mbuti), 안다만 섬 주민(Onge), Tepe Ganj Dareh 사이트(Iran_N)의 초기 신석기 이란인, 후기 홍적세 유럽 수렵 채집인(Villabruna), 브라질 원주민 Karitiana, 티베트-버마어 사용 그룹이 포함됩니다. 중국 남부(Naxi)와 일본의 고대 수렵 채집인(Funadomari Jomon)(보충 자료 13 , 16 ).
삼각측량
'삼각 측량'이라는 용어는 다른 두 지점에서 측정한 값을 수렴하여 공간의 단일 지점을 결정하는 탐색 기술에서 차용한 것입니다. 질적 연구에서 그것은 세 가지 다른 과학 분야의 증거를 사용하여 동일한 현상의 다른 차원을 포착하는 데 사용되는 방법을 지정합니다. 논쟁의 순환성을 피하기 위해 데이터 수집, 분석 및 결과는 다른 두 분야와 독립적으로 각 개별 분야의 한계 내에서 수행되거나 도달됩니다. 삼각 측량 프로세스의 마지막 단계에서만 현상을 설명하는 여러 변수를 비교하여 서로 매핑된 세 가지 분야에서 도출된 추론이 있습니다.
인류학 86 에서 삼각 측량의 이전 응용 프로그램을 기반으로 우리는 현상에 대한 더 나은 이해에 기여하기 위해 언어학, 고고학 및 유전학을 통합하여 Transeurasian 언어의 분산에 방법을 적용했습니다. 우리는 서로 다른 데이터 세트를 수집하고 위에서 설명한 방법을 적용하여 위치, 연대기, 철새 역학, 연속성 대 확산 및 생존과 같은 여러 변수와 관련하여 독립적인 추론을 도출했습니다(보충 데이터 26). 각 분야는 직간접적인 증거를 기반으로 질적이든 양적이든 자체 분야에 내부적인 도구를 적용하여 이러한 변수를 포함하는 가장 인색한 모델을 추론했습니다. 단일 규율만으로는 농업/언어 확산에 대한 문제를 결정적으로 해결할 수 없지만 세 가지 규율을 함께 사용하면 이 시나리오의 신뢰성과 타당성이 높아집니다. 세 가지 분야에서 제공하는 증거를 조정함으로써 우리는 세 가지 분야 각각이 개별적으로 제공할 수 있는 것보다 트랜스유라시아 이주에 대해 더 균형 잡히고 풍부한 이해를 얻었습니다.
보고 요약
연구 설계에 대한 추가 정보는 이 백서에 링크된 Nature Research Reporting Summary 에서 확인할 수 있습니다 .
데이터 가용성
언어 및 고고학 데이터 세트는 보충 정보를 통해 사용할 수 있습니다 . 응용 프로그램이 필요한 파일은 FigShare에 업로드되었습니다. FigShare에 대한 링크는 다음과 같습니다. 보충 데이터 3 : Transeurasian 언어의 시공간적 확장을 모델링하는 베이지안 물리학적 분석( https://figshare.com/s/b9c67ca3ea47faf51d48 ); 보충 데이터 19 : 언어 데이터베이스( https://figshare.com/s/748bf751fe3ba7752046 ) 의 분석을 실행하는 데 사용되는 모델, 사전, 하이퍼프라이어 및 설정을 지정하는 BEAST XML 파일 보충 자료 21: 고고학 데이터베이스( https://figshare.com/s/99f5aab9a2e43eb2ffd4 ) 의 분석을 실행하는 데 사용되는 모델, 사전, 하이퍼프라이어 및 설정을 지정하는 BEAST XML 파일 ; 보충 자료 24 : Transeurasian 언어의 일자 베이지안 계통발생수( https://figshare.com/s/709f239fa45982911b87 ); 및 보충 데이터 25 : 고고학 데이터베이스의 베이지안 계통발생학적 분석( https://figshare.com/s/65615dddc0817bc0184f ). figtree 애플리케이션에 대한 링크는 다음과 같습니다. https://github.com/rambaut/figtree/releases/tag/v1.4.3 유전자 데이터 세트의 경우 이 백서에 보고된 DNA 서열은 European Nucleotide Archive(ENA)에 기탁되었습니다. 가입 중PRJEB46162 . '1240k' 패널에 대한 이 연구에서 고대 개인의 반수체 유전자형 데이터는 https://edmond.mpdl.mpg.de/imeji/collection/59JGAaOpSxRb96Vh 링크에서 EIGENSTRAT 형식으로 제공됩니다 .
코드 가용성
독자는 보충 정보를 통해 언어 및 문화 데이터 세트의 베이지안 분석의 기초가 되는 코드에 액세스할 수 있습니다 . 보충 자료 19 의 파일은 언어와 관련이 있고 보충 자료 21 의 파일은 문화와 관련이 있습니다. 웹 링크는 다음과 같습니다. 보충 데이터 19 : 언어 데이터베이스의 분석을 실행하는 데 사용되는 모델, 사전, 하이퍼프라이어 및 설정을 지정하는 BEAST XML 파일( https://figshare.com/s/748bf751fe3ba7752046 ); 보충 데이터 21 : 고고학 데이터베이스( https://figshare.com/s/99f5aab9a2e43eb2ffd4 )의 분석을 실행하는 데 사용되는 모델, 사전, 하이퍼프라이어 및 설정을 지정하는 BEAST XML 파일 .
참조
Starostin, S., Dybo, A. & Mudrak, O. 알타이 언어 Vol. I–III(브릴, 2003).
Blažek, V. 알타이 언어. 연구, 조사, 분류 및 비교 문법의 스케치 (Masaryk Univ. Press, 2019)의 역사.
Robbeets, M. in The Oxford Guide to the Transeurasian Languages (eds Robbeets, M. & Savelyev, A.) 772–783 (Oxford Univ. Press, 2020).
Mallory, J., Dybo, A. & Balanovsky, O. 유라시아의 고고학 및 언어학에 대한 유전학 연구의 영향. 러스. J. 제네트. 55 , 1472–1487 (2019).
Bellwood, P. & Renfrew, C. (eds) 농업/언어 분산 가설 조사 (McDonald Institute for Archaeological Research, 2002).
Menges, K. Dravidian 및 Altaic. Anthropos 72 , 129–179 (1977).
Miller, RA 일본 언어 기원에 대한 고고학적 조명. 아시아 팩. 쿼트. Soc. 숭배. 업무 22 , 1–26(1990).
Dybo, A. 언어와 고고학: 몇 가지 방법론적 문제. 1. 인도 유럽과 알타이 풍경. J. 언어 관계 9 , 69–92 (2013).
Haak, W. et al. 대초원에서 대규모로 이주한 사람들은 유럽에서 인도유럽어족의 발원지였습니다. 자연 522 , 207–211 (2015).
Allentoft, M. et al. 청동기 시대 유라시아의 인구 유전체학. 자연 522 , 167–172 (2015).
Damgaard, P. et al. 최초의 말 목동과 초기 청동기 시대 대초원이 아시아로 확장된 영향. 과학 360 , eaar7711 (2018).
Ning, C. et al. 중국 북부의 고대 게놈은 생존 변화와 인간 이주 사이의 연관성을 제시합니다. Nat. 공동. 11 , 2700(2020).
Wang, CC et al. 동아시아의 인구 형성에 대한 게놈 통찰력. 자연 591 , 413–419 (2021).
Yang, MA et al. 고대 DNA는 중국 북부와 남부의 인구 이동과 혼합을 나타냅니다. 과학 369 , 282–288 (2020).
Francis-Ratte, A. & Unger, JM The Oxford Guide to the Transeurasian Languages (eds Robbeets, M. & Savelyev, A.) 705–714 (Oxford Univ. Press, 2020).
Anderson, G. in The Oxford Guide to the Transeurasian Languages (eds Robbeets, M. & Savelyev, A.) 715–725 (Oxford Univ. Press, 2020).
Vajda, E. in The Oxford Guide to the Transeurasian Languages (eds Robbeets, M. & Savelyev, A.) 726–734 (Oxford Univ. Press, 2020).
Robbeets, M. 일본어는 한국어, Tungusic, Mongolic 및 Turkic과 관련이 있습니까? (하라소위츠, 2005).
Robbeets, M. Diachrony of Verb Morphology: Japanese and the Transeurasian languages (Vol. 291 in Trends in Linguistics. Studies and Monographs) (Mouton de Gruyter, 2015).
Heggarty, P. & Beresford-Jones, D. in Encyclopedia of Global Archaeology (ed. Smith, C.) 1–9 (Springer, 2014).
Bellwood, P. First Farmers: 농업 사회의 기원 (Blackwell, 2005).
Starostin, S. in Past Human Migrations in East Asia: Matching Archaeology , Linguistics and Genetics (eds Sanchez-Mazas, A. et al.) 254–262 (Routledge, 2008).
Ramstedt, GJ 알타이어와 일본어의 비교. 트랜스. 아시아계 일본 두 번째 Ser. 7 , 41–54(1924).
Kæmpfer, E. De Beschryving van Japan, Benevens eene Beschryving van het Koningryk Siam (Balthasar Lakeman, 1729).
Crawford, GW in Handbook of East and Southeast Asian Archaeology (eds Habu, J., Lape, PV & Olsen, JW) 421–435 (Springer, 2018).
Stevens, C. & Fuller, D. 동아시아의 농업 확산: 가상 농부/언어 분산을 위한 고고학적 기반 . 랑. 딘. 장. 7 , 152–186 (2017).
Leipe, C. et al. 동아시아의 기장 농업의 불연속적인 확산과 선사 시대 인구 역학. 과학. 고급 5 , eaax6225(2019).
Stevens, C. et al. 중국에서 Panicum miliaceum (common, proso 또는 broomcorn 기장) 의 가축화 모델 . 채소. 역사. 고고학봇. 30 , 21–33(2021).
Shelach-Lavi, G. et al. 중국 북동부의 정주와 식물 재배는 풍요로운 조건에서 나타났습니다. PLoS ONE 14 , e0218751 (2019).
Lee, GA in Handbook of East and Southeast Asian Archaeology (eds Habu, J., Lape, P. & Olsen, J.) 451–481 (Springer, 2017).
Li, T. et al. 중국 동북부에서 러시아 극동 지역으로 분산된 기장 농업: 고고학, 유전학 및 언어학 통합. 고고학. 해상도 아시아 22 , 100177 (2020).
Nelson, SM et al. 섬유 생산의 언어학과 고고학을 통해 고대 동아시아의 인구 이동을 추적합니다. 진화 흠. 과학. 2 , e5(2020).
Hudson, MJ 정체성의 폐허: 일본 열도의 민족 발생 (Univ. Hawai'i Press, 1999).
Qin, L. & Fuller DQ in Prehistoric Maritime Cultures and Seafaring (eds Wu, C. & Rolett, B.) 159–191 (Springer, 2019).
Hosner, D. et al. 신석기 및 청동기 시대 중국 고고학 유적지의 시공간적 분포 패턴: 개관. 홀로세 26 , 1576–1593 (2016).
Hudson, MJ & Robbeets, M. 한국어 양식/언어 분산에 대한 고고학적 증거. 진화 흠. 과학. 2 , e52(2020).
정C. 외. 유라시아 동부 대초원의 역동적인 6,000년 유전사. 세포 183 , 890–904 (2020).
Savelyev, A. & Jeong, C. 동부 대초원의 초기 유목민과 서부에서의 잠정적 연결. 진화 휴먼 사이언스 2 , e20(2020).
Janhunen, J. in The Mongolic languages (ed. Janhunen, J.) 1–29 (Routledge, 2003).
Hudson, MJ in New Perspectives in Southeast Asian and Pacific Prehistory (eds Piper, P., H. Matsumura, H. & Bulbeck, D.) 189–199 (ANU Press, 2017).
Sagart, L. et al. 오래된 언어 계통 발생은 Sino-Tibetan의 조상에 빛을 비춰줍니다. 절차 Natl Acad. 과학. USA 116 , 10317–10322 (2019).
Zhang, H. et al. 날짜가 지정된 계통 발생은 SinoTibetan 언어의 초기 신석기 시대 기원을 암시합니다. 과학. 10 , 20792 (2020).
Haspelmath, M. & Tadmor, U. Loanwords in the World's Languages: a Comparative Handbook (Mouton de Gruyter, 2009).
Heggarty, P. & Anderson, C. 기본 어휘의 Cognacy (CoBL) , https://www.shh.mpg.de/dlce-research-projects/ie-cor-database (Max Planck Institute for the Science of Human History) , 2015).
Savelyev, A. & Robbeets, M. 베이지안 계통언어학은 투르크어족의 내부 구조와 시간 깊이를 추론합니다. J.랭. 진화하다 . 39–53(2019).
Oskolskaya, S., Koile, E. & Robbeets, M. Tungusic 언어 분류에 대한 Bayesian 접근법. 디아크로니카 https://doi.org/10.1075/dia.20010.osk (2021).
Bouckaert, R., Bowern, C. & Atkinson, QD 호주 전역의 Pama-Nyungan 언어의 기원과 확장. Nat. 에코. 진화 2 , 741–749 (2018).
Bouckaert, R. & Robbeets, M. Pseudo Dollo는 트리를 따라 이진 문자의 진화를 위한 모델입니다. https://doi.org/10.1101/207571(2018 ) 에서 사전 인쇄 .
Drummond, AJ et al. 편안한 계통 발생학 및 자신감있는 데이트. PLoS Biol. 4 , e88(2006).
Gavryushkina, A. et al. 역학 및 화석 보정을 위한 샘플링된 조상 나무의 베이지안 추론. 플로스컴퓨팅. 비올. 10 , e1003919 (2014).
Maturana, PM 외. 중첩 샘플링을 사용한 계통 발생학의 모델 선택 및 매개변수 추론. 시스템 비올. 68 , 219–233(2019).
Bouckaert, R. et al. BEAST 2.5: 베이지안 진화 분석을 위한 고급 소프트웨어 플랫폼입니다. 플로스컴퓨팅. 비올. , 15 , e1006650 (2019).
Mueller, NF & Bouckaert, R. BEAST 2용 적응형 병렬 템퍼링. https://doi.org/10.1101/603514(2020 )에서 사전 인쇄.
Bouckaert, R. 구체에 확산에 의한 Phylogeography: 전 세계 Phylogeography. PeerJ , 4 , e2406(2016).
Wichmann, S. & Rama, T. 합성 데이터를 사용한 언어 고향 감지 테스트 방법. https://doi.org/10.1101/2020.09.03.280826(2020 ) 에서 사전 인쇄 .
Neureiter, N., Ranacher, P., van Gijn, R., Bickel, B. & Weibel, R. 2021 베이지안 계통 지리학은 언어 진화의 이동과 확장을 재구성할 수 있습니까? R. Soc. 오픈 사이언스 8 , 201079 (2021).
Mace, R., Holden, C. & Shennan, S. 문화 다양성의 진화 - 계통 발생적 접근 (UCL Press, 2005).
O'Brien, MJ & Lyman, RL 진화 고고학: 현재 상태 및 미래 전망. 진화 안트로폴. 11 , 26–36(2002).
Allaby, RG, Fuller, DQ & Brown, TA 길들여진 작물의 기원에 대한 장기간 모델의 유전적 기대. 절차 Natl Acad. 과학. USA 105 , 13982-13986 (2008).
Drummond, AJ et al. 분자 서열에서 과거 인구 역학의 베이지안 합체 추론. 몰. 비올. 진화 22 , 1185–1192 (2005).
Shelach, G. & Teng, M. in A Companion to Chinese Archaeology (ed. Underhill, A.) 37–54 (Wiley–Blackwell, 2013).
Miyamoto, K. 동북아시아로의 초기 농업의 초기 확산. 아시아 고고학 . 3 , 11–26(2014).
Li, T., Ning, C., Zhushchikhovskaya, IS, Hudson, MJ & Robbeets, M. Millet 농업은 중국 북동부에서 러시아 극동 지역으로 분산: 통합 고고학, 유전학 및 언어학. 고고학. 해상도 아시아 22 , e100177 (2020).
Kōmoto, M. in A Study on the Environmental Change and Adaptation System in Prehistoric Northeast Asia (ed. Kōmoto, M.) 8–34 (Kumamoto Univ., 2007).
An, S. (ed.) 논외의고학 (사회평논, 2013).
Nishitani, T. (ed.) Higashi Ajia ni okeru shisekibo no sōgōteki kenkyū (Kyushu Univ., 1997).
Furusawa, Y. in A Study on the Environmental Change and Adaptation System in Prehistoric Northeast Asia (ed. Kōmoto, M.) 86–109 (Kumamoto Univ., 2007).
Dabney, J. et al. 초단파 DNA 조각으로 재구성한 중기 홍적세 동굴곰의 완전한 미토콘드리아 게놈 서열. 절차 Natl Acad. 과학. USA 110 , 15758–15763 (2013).
Peltzer, A., Herbig, A. & Krause, J. EAGER: 효율적인 고대 게놈 재구성. 게놈 바이오. 17 , 60(2016).
Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2: 신속한 어댑터 트리밍, 식별 및 읽기 병합. BMC 해상도 주석 9 , 88(2016).
Li, H. et al. 시퀀스 정렬/맵 형식 및 SAMtools. 생물 정보학 25 , 2078–2079 (2009).
Jun, G. et al. 모집단 규모의 DNA 서열 데이터에서 변형 추출 및 정제를 위한 효율적이고 확장 가능한 분석 프레임워크입니다. 게놈 해상도 25 , 918–925 (2015).
Mathieson, I. et al. 230명의 고대 유라시아인에서 게놈 차원의 선택 패턴. 자연 528 , 499–503 (2015).
Haak, W. et al. 대초원에서 대규모로 이주한 사람들은 유럽에서 인도유럽어족의 발원지였습니다. 자연 522 , 207–211 (2015).
정C. 외. 유라시아 내륙에 걸친 혼합의 유전적 역사. Nat. 에코. 진화 3 , 966–976 (2019).
정C. 외. 청동기 시대 인구 역학 및 동부 유라시아 대초원에서의 유제품 목축업의 부상. 절차 Natl Acad. 과학. 미국 115 , E11248–E11255(2018).
Mallick, S. et al. The Simons Genome Diversity Project: 142개 다양한 집단의 300개 게놈. 자연 538 , 201–206 (2016).
Jónsson, H., Ginolhac, A., Schubert, M., Johnson, PLF & Orlando, L. mapDamage2.0: 고대 DNA 손상 매개변수의 빠른 대략적인 베이지안 추정치. 생물 정보학 29 , 1682–1684 (2013).
Renaud, G., Slon, V., Duggan, AT & Kelso, J. Schmutzi: 오염 추정 및 고대 DNA를 요구하는 내인성 미토콘드리아 합의. 게놈 바이오. 16 , 224(2015).
Korneliussen, TS, Albrechtsen, A. & Nielsen, R. ANGSD: 차세대 시퀀싱 데이터 분석. BMC Bioinformatics 15 , 356(2014).
Skoglund, P. et al. 시베리아 네안데르탈인의 현대 오염으로부터 내인성 고대 DNA 분리. 절차 Natl Acad. 과학. USA 111 , 2229–2234 (2014).
Patterson, N., Price, AL & Reich, D. 인구 구조 및 고유 분석. 플로스 제넷. 2 , e190(2006).
Raghavan, M. et al. 상부 구석기 시대 시베리아 게놈은 아메리카 원주민의 이중 조상을 보여줍니다. 자연 505 , 87–91 (2014).
Patterson, N. et al. 인류 역사의 고대 혼합물. 유전학 192 , 1065–1093 (2012).
Fu, Q. et al. 최근의 네안데르탈인 조상이 있는 루마니아 출신의 초기 현생인류. 자연 524 , 216–219 (2015).
Kirch, PV & Green, R. Hawaiki, Ancestral Polynesia: An Essay in Historical Anthropology (Cambridge Univ. Press, 2001).
Oh, Y., Conte, M., Kang, S., Kim, J. & Hwang, J. 선사 시대 한국의 인구 변동과 식량 생산 채택: 방사성 탄소 연대를 인구 변화의 프록시로 사용. 방사성 탄소 59 , 1761–1770 (2017).
호스너. D., Wagner, M., Tarasov, PE, Chen, X. & Leipe, C. 신석기 및 청동기 시대 중국 고고학 유적지의 시공간적 분포 패턴: 개요. 홀로세 26 , 1576–1593 (2016).
Koyama, S. Jomon 생활과 인구. 센리 에놀. 마개. 2 , 1–65(1978).
감사의 말
이러한 결과로 이어지는 연구는 MRRB에 부여된 유럽 연합의 Horizon 2020 연구 및 혁신 프로그램(보조금 계약 번호 646612)에 따라 유럽 연구 위원회로부터 자금을 지원받았으며 왕립 학회의 Marsden 보조금 18-UOA-096의 지원을 받았습니다. 뉴질랜드. N. Adachi, T. Kakuda, E. Savelyeva, W. Lawrence, S. Wichmann, C. Wang, M. Burri, N. Klyuev, I. Zhushchikhovskaya, M. Byington, H. Miyagi, Y. Vostretsov, A. Jarosz, J.-O. Svantesson, M. Levy, J. Lefort, M. Miller, K. Mishchenkova, E. Perekhvalskaya, I. Nikolaeva, P. Czerwinski, N. Aralova, A. Francis-Ratte, I. Joo, R. Máté, T. 데이터 수집, 분석, 해석에 도움을 주신 펠라드와 국립중앙박물관.
펀딩
Max Planck Society에서 제공하는 오픈 액세스 기금.
작가 정보
저자 및 소속
Max Planck Institute for the Science of Human History, 예나, 독일
Martine Robbeets, Remco Bouckaert, Alexander Savelyev, Tao Li, Joanna Dolińska, Sofia Oskolskaya, Bingcong Deng, Rasmus Bjørn, Ricardo Fernandes, Patrick Roberts, Linda Gilaizeau, Raffaela A. Bianco, Marie Himmel, Mark J. Hudson & Chao Ning
컴퓨터 진화 센터, 오클랜드 대학교, 오클랜드, 뉴질랜드
렘코 부카르트
서울대학교 고고미술사학과
Matthew Conte & 김건영
언어학 연구소, 러시아 과학 아카데미, 모스크바, 러시아
알렉산더 사벨리예프, 일리야 그룬토프, 올가 마조
중국 우한시 우한대학교 고고학과
타오리
양쯔 문명 고고학 연구소(AIYC), 우한 대학교, 우한, 중국
타오리
한서대학교 문화유산보존학과
안덕임
일본 쓰쿠바 국립과학박물관 인류학과
시노다 켄이치 & 칸자와-키리야마 히데아키
중국 창춘 길림대학교 생명과학부
추이 인추 & 장 판
중국 장춘시 길림대학교 길림대학교 중국전방고고학연구센터
추이 인추
히로시마 대학 박물관, 히가시 히로시마, 일본
가와시마 타카무네
Sainsbury Institute for the Study of Japanese Arts and Culture, 노리치, 영국
우치야마 준조 & 일로나 R. 바우쉬
문화 자원 연구 센터, 가나자와 대학, 가나자와, 일본
우치야마 준조
언어 연구소, 러시아 과학 아카데미, 상트페테르부르크, 러시아
소피아 오스콜스카야
매장문화재 연구센터, 구마모토 대학, 구마모토, 일본
야마노 켄 요지로
큐슈대학교 사회문화학부 환경변화학과, 후쿠오카, 일본
세구치 노리코
미국 몬태나주 미줄라주 몬태나대학교 인류학과
세구치 노리코
홋카이도 정부 교육위원회, 삿포로, 일본
토미타 히로타카
규슈대학 글로벌사회종합과학연구과
토미타 히로타카
태평양 제도 연구 센터, 가고시마 대학, 가고시마, 일본
타카미야 히로토
도쿄대학 이학연구과 생명과학과
오타 히로키
일본 니시하라 류큐대학교 의과대학원
이시다 하지메 & 키무라 료스케
일본 가나자와현 가나자와대학교 의과대학 생물정보학 및 유전체학과
사토 다케히로
동아대학교 고고미술사학과
김재현
한국외국어대학교, 서울, 대한민국
이성하 & 안규동
국립 연구 대학 고등 경제 학교, 모스크바, 러시아
일리야 그룬토프 & 올가 마조
미국 일리노이주 데칼브 노던일리노이대학교 세계언어문화학과
존 R. 벤틀리
체코 브르노 마사리크 대학교 예술학부
리카르도 페르난데스
옥스퍼드대학교 고고학과, 옥스퍼드, 영국
리카르도 페르난데스
라이덴 대학교 지역 연구 연구소, 레이덴, 네덜란드
일로나 R. 바우쉬
고쿠가쿠인 대학 박물관, 도쿄, 일본
일로나 R. 바우쉬
일본 도쿄도 대학 박물관
요네다 미노루
미야코지마시 교육위원회, 미야코지마, 일본
쿠가이 미츠구
Institut d'Asie Orientale, ENS de Lyon, 리옹, 프랑스
마크 J. 허드슨
중국 북경대학교 고고학 및 박물관학부
차오닝
기여
연구는 MR에 의해 개념화되었습니다 언어 데이터 세트는 AS, JD, SO, BD, R. Bjørn, SR, K.-DA, IG, OM, JRB 및 MR에 의해 수집되었습니다 언어 데이터베이스는 MR에 의해 채점되고 MR 및 R에 의해 분석되었습니다 .부카에트. 어원학은 MR에 의해 설정되었습니다. 고고학 데이터베이스는 TL, MC, TK, GK, JU 및 LG에 의해 채점되었으며 MJH, R. Bouckaert, MR, MC 및 IRB에 의해 분석되었습니다. Nagabaka 사이트는 TK 및 K.-YY에 의해 발굴되었습니다. MK와 HI의 조언으로 MJH의 방향 K.-YY, TK, NS, H. Tomita, H. Takamiya, JU, PR, RF 및 MYYC가 Nagabaka에서 발굴된 자료의 발굴 후 분석을 분석하여 Angangxi 데이터를 공유했습니다. 디아. J.-HK는 고대 한국 데이터, KiS는 야요이 데이터, HI, RK, TS 및 HO는 현대 류큐 데이터입니다. 한국과 일본의 고대 DNA 데이터에 대한 습식 실험실 작업은 RAB와 MH에 의해 수행되었습니다. 유전자 데이터 분석은 HK-K의 입력으로 CN에 의해 수행되었습니다. 그리고 FZ 작성은 MR, MJH 및 CN에 의해 수행되었습니다.
교신저자
Martine Robbeets , Mark J. Hudson 또는 Chao Ning 에 대한 서신 .
윤리선언문
경쟁 관심
저자는 경쟁 이익을 선언하지 않습니다.
추가 정보
동료 검토 정보 Nature는 Peter Bellwood, Václav Blažek, Dorian Fuller, Carles Lalueza-Fox 및 이 작업의 동료 검토에 기여한 다른 익명의 검토자(들)에게 감사드립니다. 피어 리뷰어 보고서를 사용할 수 있습니다.
게시자의 메모 Springer Nature는 게시된 지도 및 소속 기관의 관할권 주장과 관련하여 중립을 유지합니다.
확장 데이터 그림 및 표
확장 데이터 그림 1 그림 1 의 범례 .
주요 그림 1과 함께 제공되는 자세한 범례.
확장 데이터 그림 2 그림 2 의 범례 .
기본 그림 2와 함께 제공되는 자세한 범례.
확장 데이터 그림 3 신석기 시대와 청동기 시대의 농업에 따른 인구학적 변화. 동북아시아.
A1은 기장 재배 ca를 채택한 후 변화를 보여줍니다. 8000–4000 BP, West Liao의 도자기 양을 사용하여 29 B2는 한국의 방사성 탄소 프록시 날짜를 사용하여 이러한 변화를 보여줍니다 87 . 그림 A에서 E는 장기 역학 ca를 보여줍니다. 8000–2000 BP 청동기 시대에 기장과 쌀, 보리, 밀이 통합된 후 북동부 중국 88 , 한국 87 , 일본 89 사이트 번호에 대한 사이트 번호를 기반으로 합니다 . 프록시에서 인구 통계 정보를 추출하는 데 사용되는 참조 및 방법은 보충 데이터 7 을 참조하십시오 .
Extended Data 그림 4 시간과 공간에 위치한 고대 게놈.
기본 그림 3 및 확장 데이터 그림에 수반되는 자세한 범례를 포함합니다. 7–10.
확장 데이터 그림 5 현재 유라시아인의 유전적 구조를 보여주는 PCA.
PC1은 서부 및 동부 유라시아 인구, PC2 남부 및 북부 유라시아 인구를 구분합니다. 트랜스유라시아 개체군은 아과(투르크계는 회색, 몽골계는 주황색, 퉁구스계는 노란색, 한국계는 분홍색, 일본계는 밝은 회색)에 따라 색상이 지정됩니다. Transeurasian이 아닌 인구는 가족에 따라 색상이 지정됩니다. 인구는 세 글자로 표시되며 약어 목록은 보충 데이터 10을 참조하십시오 .
Extended Data 그림 6 현재 동아시아인의 유전적 구조를 보여주는 PCA.
인구는 세 글자로 표시되며 약어 목록은 보충 데이터 10을 참조하십시오 .
Extended Data 그림 7 PCA에 표시된 고대 게놈은 현재 동아시아인의 유전 구조를 보여줍니다.
자세한 범례는 확장 데이터 그림 4 를 참조하십시오 .
확장 데이터 그림 8 오늘날 유라시아인의 유전 구조를 나타내는 PCA에 표시된 고대 게놈.
자세한 범례는 확장 데이터 그림 4 를 참조하십시오 .
확장 데이터 그림 9 청동기 시대, 철기 시대, 서랴오 및 아무르의 고대 게놈은 현재 유라시아인의 유전 구조를 나타내는 PCA에 플로팅되었습니다.
자세한 범례를 위해. 확장 데이터 그림 4 를 참조하십시오 .
확장 데이터 그림 10 현재 유라시아인의 유전 구조를 보여주는 PCA에 플로팅된 Primorye, 동부 대초원 및 황하의 고대 게놈.
자세한 범례는 확장 데이터 그림 4 를 참조하십시오 .
추가 정보
이 파일에는 Supplementary Data Files 1–26에 대한 전체 가이드가 포함되어 있습니다. 보충 데이터 파일 3 및 21은 외부에서 호스팅됩니다. 자세한 내용은 이 보충 가이드 파일 내의 링크를 참조하십시오.
이 압축 파일에는 보충 데이터 파일 1, 2 및 4–6이 포함되어 있습니다. 전체 설명은 보충 정보 파일을 참조하십시오(보충 데이터 파일 3은 외부에서 호스팅됨, 링크는 보충 정보 파일 참조).
이 압축 파일에는 보충 데이터 파일 7–11이 포함되어 있습니다. 자세한 설명은 보충 정보 파일을 참조하십시오.
이 압축 파일에는 보충 데이터 파일 12–16이 포함되어 있습니다. 자세한 설명은 보충 정보 파일을 참조하십시오.
이 압축 파일에는 보충 데이터 파일 17–20 및 22가 포함되어 있습니다. 전체 설명은 보충 정보 파일을 참조하십시오(보충 데이터 파일 21은 외부에서 호스팅됨, 링크는 보충 정보 파일 참조).
이 압축 파일에는 보충 데이터 파일 23–26이 포함되어 있습니다. 자세한 설명은 보충 정보 파일을 참조하십시오.
권리 및 권한
Open Access 이 기사는 Creative Commons Attribution 4.0 International License에 따라 라이선스가 부여되며, 원본 작성자와 소스에 적절한 크레딧을 제공하는 한 모든 매체 또는 형식으로 사용, 공유, 개작, 배포 및 복제를 허용합니다. 크리에이티브 커먼즈 라이선스에 대한 링크를 제공하고 변경 사항이 있는지 표시합니다. 이 기사의 이미지 또는 기타 제3자 자료는 자료에 대한 크레디트 라인에 달리 명시되지 않는 한 기사의 크리에이티브 커먼즈 라이센스에 포함됩니다. 기사의 크리에이티브 커먼즈 라이선스에 자료가 포함되어 있지 않고 귀하의 의도된 사용이 법적 규정에 의해 허용되지 않거나 허용된 사용을 초과하는 경우 저작권 소유자로부터 직접 허가를 받아야 합니다. 이 라이센스의 사본을 보려면 다음을 방문하십시오.http://creativecommons.org/licenses/by/4.0/ .
이 기사에 대해
이 기사를 인용하십시오
Robbeets, M., Bouckaert, R., Conte, M. 외. 삼각 측량은 Transeurasian 언어의 농업적 확산을 지원합니다. 자연 599 , 616–621 (2021). https://doi.org/10.1038/s41586-021-04108-8
이 기사 공유
다음 링크를 공유하는 사람은 누구나 이 콘텐츠를 읽을 수 있습니다.
공유 가능한 링크 가져오기
Springer Nature SharedIt 콘텐츠 공유 이니셔티브에서 제공
과목
이 글을 인용한 사람은
트랜스유라시아어(Transeurasian languages)의 농업적 확산을 뒷받침하는 삼각 측량(Triangulation)
2021년11월25일 Nature 599, 7886
트랜스유라시아(Transeurasian) 또는 알타이(Altaic) 언어군은 매우 고대 언어이며 동쪽의 일본, 한국 및 시베리아에서 서쪽의 터키에 이르기까지 유라시아 전역에 퍼져 있다. 이 언어군의 기원과 확산에 대해서는 아직까지도 많은 논란 존재한다. 본 연구에서 연구진들은 역사적 언어학, 고대 DNA 및 고고학을 결합하여 트랜스유라시아어는 약 9,000년 전 중국 북동부 랴오 계곡의 초기 서곡(Millet) 농부들과 인접한 아무르 계곡(지금의 러시아 극동)에서 기원한 유전자 풀까지 거슬러 올라갈 수 있음을 보여주었다. 그곳에서 북쪽과 서쪽은 시베리아와 대초원, 동쪽은 한국과 일본으로 퍼졌다.
ARTICLE p.616doi: 10.1038/s41586-021-04108-8
NEWS & VIEWS p.557doi: 10.1038/d41586-021-03037-w
트랜스유라시아어의 기원과 확산 - 동북공정에 반하는 10개국의 언어학·고고학·유전학 교차 연구
유라시아문화
2022, vol.6, 통권 6호 pp. 251-268 (18 pages)
DOI : 10.47527/JNAH.2022.02.6.251
발행기관 : 유라시아문화학회
연구분야 :
>
1(사)국학원 연구위원
초록 열기/닫기 버튼
이 논문은 언어학ㆍ고고학ㆍ유전학 세 학문의 교차연구 결과, 트랜스유라시아어족은 서요하 지역 기장 농부들의 언어에서 시작되어 인접 지역으로 인구가 확산되면서 농경과 함께 언어도 유전자도 전파되어 갔다는 새로운 가설을 주장하며, 그 언어와 문화 전파 경로에 의한 트랜스유라시아 언어ㆍ문화벨트를 상정하고 있다. 유라시아시대가 열리고 있는 이때에 상고시대 유라시아를 관통하는 트랜스유라시아 문화벨트를 상정하였다는 것은 큰 의미가 있다고 본다. 그리고 그 언어⋅문화벨트를 통해 중국 측에는 중국의 시원문명은 황하 문명이며, 자기네 시원문명으로 정한 요하문명과 황하문명은 언어학적⋅고고학적⋅유전학적으로 하등의 관계가 없는 두 개의 독자적이고 이질적인 문명임을 확인하였고, 한국 측에는 요하문명이 우리의 언어⋅혈통⋅문화의 뿌리로서 우리와 떼려야 뗄 수 없는 관계임을 확인시켜주고 있다. 그러나 앞서 이 논문에서도 서유라시아에 비해 동유라시아, 특히 내몽고, 황하⋅요하⋅아무르강 유역, 러시아 극동지역, 한반도와 일본열도를 아우르는 광대한 지역인 동북아에 대한 연구가 아직 많이 부족함을 지적하였듯이, 이 논문이 이룬 큰 업적들에도 불구하고 논문에 2000년대 이후 소남산문화를 비롯한 아무르강 유역- 특히 길흑지구(길림성과 흑룡강성)에서의 수많은 고고학적 발굴 결과가 전혀 반영되어 있지 않은 것은 아쉬운 점으로 남는다. 이 지역은 상고 이래 고구려⋅발해시기까지 한국사의 무대였던 만큼 우리에게 특별한 의미가 있는 지역이다. 필자는 이 논문에서 트랜스유라시아 언어와 문화의 시원을 서요하로 본 이유가 트랜스유라시아 문화의 내용을 ‘농경’을 중심으로 파악했기 때문이 아닌가 한다. 하지만 트랜스유라시아 문화의 성격과 시원에 대해서는 다양한 견해가 있을 수 있다고 본다. 최근에는 시원을 ‘아무르(흑룡)강’으로 바라보는 연구들도 나왔는데, 그 중 하나가 상고시대 동북아에 널리 퍼져있는 옥기문화를 중심으로 트랜스유라시아 문화의 내용을 파악한 연구이다. 그 연구에서는 옥기문화의 시원을 삼강평원 일대 오소리 강변의 소남산문화로 보고, 그 문화의 뿌리를 구석기 후기 동시베리아 바이칼까지 소급시키고 있다. 반면 이 논문에 나오는 ‘아무르 유역’은 다만 서요하 지역에서 시작된 기장 농사가 5000년 전에 아무르를 거쳐 연해주로 전해지면서 원시 트랜스유라시아어에서 갈라져 나온 원시 퉁구스어가 농경문화와 함께 인구의 이동을 따라 아무르 지역으로 전파된 것으로만 나와 있다. 그러니까 ‘서요하⇒아무르’라는 이동 방향만 언급되어 아무르는 일방적으로 문화를 전해 받은 지역으로만 되어 있는 것이다. 그러나 필자는 논문의 유전학 부분에서 아무르 혈통을 트랜스유라시아 언어의 시원으로 보고 있는 점에 주목하게 된다. 트랜스유라시아어의 기원이 초기 아무르 유전자 pool까지 거슬러 올라갈 수 있다고 하였고, 아무르 혈통이 후기 구석기시대 바이칼, 아무르, 연해주, 동남부 스텝과 서요하의 수렵채취인들의 오리지널 토종 게놈을 대표한다고 하였다. 또 트랜스유라시아의 언어와 농경문화의 시원이 신석기시대 서요하 기장 경작자들이라고 하면서도, 이 초기 농부들 또한 아무르 혈통 비율이 상당히 높다가 시간이 지남에 따라 점차 황하 게놈으로 옮겨간다고 하였고, 이 아무르 혈통이 한국어와 일본어 사용자들에게까지 추적된다고 하였다. 그리하여 트랜스유라시아 언어 사용자들 모두에게 아무르 혈통은 ‘공통된 시원의 유전적 요소’로 보인다고 결론짓고 있다. 이 논문의 연구는 지금부터 ‘9000년 전’에서 시작되고 있지만, 9000년 전 기장 농사 이전에도 유라시아 대륙에서 인류는 살고 있었고 나름의 수준 높은 정신문화를 이루고 살았음을 발굴된 유적ㆍ유물들을 통해 알 수 있다. 아무르 혈통이 후기 구석기시대 바이칼, 아무르, 연해주, 동남부 스텝과 서요하의 수렵채취인들의 오리지널 토종 게놈을 대표한다고 하였으니, 아무르는 9000년 전보다 더 이전의 시간에 유라시아에 널리 퍼져있던 게놈이며 서요하의 시원일 수 있다고 생각되는 것이다. 그러니까 유전학의 연구 결과는 ‘서요하⇒아무르’로의 언어와 문화의 이동이 있기 전에 먼저 ‘아무르⇒서요하’로 유전자 이동이 있었음을 보여주고 있는 것이다. 이 논문에 의하면 인구의 이동은 언어와 문화의 이동이며 동시에 유전자의 이동이기도 하다. 아무르에 대해 미진한 부분은 이 논문으로 인해 촉발될 많은 연구들이 해결해주리라 생각된다. 지금 이 순간에도 이루어지고 있는 새로운 고고학적 발굴들, 그리고 연계된 학문들의 발달과 학제 간 협력을 통한 공동연구로 앞으로 더 많은 것들이 밝혀질 수 있을 것이다. 이 논문을 계기로 지금의 국경 안에 갇혀 상고사를 논하는 연구 경향에서 과감히 탈피, 국경이나 학문간 경계를 넘어 모든 자료에 열린 마음으로 나아가게 되기를 희망한다.