요약
한국 토종 개 품종과 다른 아시아 개 개체군의 조상 및 계통발생학적 관계를 연구하기 위해 205마리의 개과 개체의 전체 게놈 서열에서 뉴클레오티드 변이를 분석했습니다. 사사리, 북부 중국 토착 개, 티베탄 마스티프는 주로 서부 유라시아 조상과 관련이 있습니다. 진도, 동경이, 시바, 중국 남부 토착견(SCHI), 베트남 토착견(VIET), 인도네시아 토착견은 동남아시아 및 동아시아 혈통에 속해 있다. 동아시아 개 품종 중에서 Sapsaree는 독일 셰퍼드와 가장 높은 일배체형을 나타냈으며, 이는 고대 유럽 조상과 현대 동아시아 개 품종이 혼합되었음을 나타냅니다. SCHI는 다른 아시아 품종보다 뉴기니의 노래하는 개, VIET 및 진도와 더 큰 일배체형 공유를 보였습니다. 동아시아 인구가 공통 조상으로부터 분기될 것으로 예상되는 시기는 약 2,000년에서 11,000년 전이었습니다. 우리의 결과는 한반도 개의 유전 역사에 대한 이해를 아시아 대륙과 해양 지역으로 확장합니다.
그래픽 초록
주제 영역
동물
진화 생물학
계통 유전학
소개
개는 길들여져 인간과 함께 반려 동물로 이주한 대형 육식 동물입니다.1,2지난 400년 동안 인간에 의한 수많은 현대 개 품종(Canis lupus familiaris)의 개발로 인해 매우 다양한 표현형 특징을 가진 200개 이상의 개 품종이 존재합니다.3 최근 게놈 시퀀싱 기술의 발전으로 야생 개과 동물, 품종 및 토착 개, 선사 시대 개를 포함한 다양한 개과 동물의 게놈 시퀀싱이 크게 촉진되었습니다.1,4,5,6,7 게놈 서열을 사용한 집단 유전 분석은 인간과 개 사이의 평행 진화를 포함하여 국내 개의 기원과 인류 역사와 관련된 다양성에 대한 우리의 이해를 크게 확장했습니다.1,4,6,7,8,9
이전 연구에서는 15,000-33,000년 전에 동아시아, 중국 동남, 중동, 유럽 및 고지대 북극의 한 마리 또는 여러 늑대 개체군에서 회색 늑대에서 가축화 과정이 시작되어 개를 가장 먼저 길들여진 동물로 만들었다고 제안했습니다.4,5,10 그러나 현대 개들의 역사에 대한 합의는 아직 이루어지지 않았다. 다양한 지역의 토착 개 게놈을 분석하는 추가 연구는 현대 개의 역사에 관한 다양한 가설을 통합하는 데 도움이 될 수 있습니다.
기원전 5,500년에서 2,000년 사이의 고고학 유적지의 증거는 신석기 시대 한반도에서 개 사육이 행해졌음을 시사합니다.11 한반도 토종 개의 초기 역사를 강조합니다. 사실 한반도는 빙하기 동안 한반도의 서쪽 해안선이 없는 아시아 대륙과 인접해 있었다. 따라서 한국에 신석기 시대 이전에 개가 있었다는 고고학적 증거는 발견되지 않았지만, 한국 토종 개의 게놈 분석은 한반도 근대 개의 초기 역사에 대한 지식을 넓힐 수 있을 것이다.
제주, 동경이, 진도, 풍산, 삽사리를 포함한 여러 한국 토종 개 품종이 인정되었습니다.12 동경이, 진도, 삽사리는 현재 국내에서 천연기념물로 지정되어 있다. SNPs 유전자형 분석을 이용한 이전 연구에서는 단발 한국 토종 개가 일본 및 중국 개 품종과 함께 계통발생학적으로 군집되어 있음을 보여주었습니다.12 또 다른 연구에서는 한국의 장모종 견종인 삽사리가 티베트의 장모견과 관련이 있을 수 있다고 추론했다.13 최근 여러 연구에서 다양한 개 품종과 야생 개과 동물의 유전 구조가 보고되었지만,4,14 국내 개의 초기 조상과 관련된 한국 토종 개의 기원과 조상은 아직 해결되지 않았습니다. 또한, 전유전체 염기서열분석(WGS) 정보를 이용한 한국 토종 견종의 조상 및 계통발생학적 관계에 대한 심층 분석은 현재까지 수행되지 않았다.
본 연구에서는 한국 토종 품종 삽사리와 진도 25종, 중국 품종 180종을 대상으로 25마리의 개를 대상으로 WGS를 실시하고, 한국 토종 견종의 조상을 이해하기 위해 공개 데이터베이스에서 입수할 수 있는 <>개 개과 동물의 <>개 게놈 염기서열과 함께 유전적 관계를 분석하였다. 우리는 한국 토종 개 품종의 기원을 아시아 및 오세아니아 지역의 가축화 및 이주 이력 측면에서 조사했습니다. WGS 데이터 분석을 통해 한국 토종 견종의 유전적 역사를 밝히면 아시아와 오세아니아의 도종 품종 역사에 대한 이해를 풍부하게 할 수 있습니다.
결과205종의 개 품종과 23종의 야생 개과 개체군의 4명의 개체에 대한 전체 게놈 시퀀싱 데이터 준비
우리는 한국의 토종 품종인 삽사리와 진도 44종과 중국 품종인 티베탄 마스티프, 페키니즈, 퍼그 60종으로 구성된 33개의 동아시아 개 품종에 대해 각각 70명의 게놈을 시퀀싱하여 평균 적용 범위가 782070.180×, ∼83×에서 ∼16× 범위였습니다(바이오프로젝트: PRJNA39). 또한 34 개의 아시아 품종에 속하는 1 마리, 2 개의 유럽 품종에 속하는 1 마리, 선사 시대 개 983 마리, 뉴기니 노래하는 개 163 마리 (Canis dingo hallstromi), 딩고 1 마리 (Canis lupus dingo), 회색 늑대 772 마리 (Canis lupus chanco), 히말라야 늑대 390 마리 (Canis lupus chanco) 및 코요테 89 마리 ( Canis latrans)를 공용 데이터베이스(테이블 S37 및 S171)에서 찾을 수 있습니다. 총 35,319,513 개의 변종이 호출되었으며 그 중 20,002,237 개 (56.63 %)가 SNP였습니다. 3 개의 현대 개과 개체로 구성된 데이터 세트에서 20,46,08 개 (18.76 %)의 SNP를 포함하여 1,85,52 개의 변종을 얻었습니다. 변이의 깊이 또는 관찰된 변이에 해당하는 매핑된 판독 수는 1.72×에서 <>.<>× 범위였으며 현대 품종 데이터 세트의 경우 평균은 <>.<>×였습니다(표 S<>). 대부분의 변이(<>.<>%)는 비암호화 영역에 위치했으며 현대 품종 데이터 세트에서 변이의 작은 비율(<>.<>%)이 유전자 영역에 있었습니다.
한국 토종 개 품종에 대한 두 가지 다른 조상 혈통
UPGMA 트리는 뉴기니의 노래하는 개, 늑대, 코요테를 포함한 148마리의 개와 23마리의 야생 개과 개체군에서 1마리의 개체를 사용하여 개과 동물 간의 쌍별 IBS(Identity-by-State) 거리를 사용한 클러스터링 분석으로 구성되었습니다(그림 1A). 중국 북부 토착견, 남부 중국 토착견, 베트남 토착견을 제외한 모든 개 개체군이 단일계통 군집을 형성했다(그림 1A 및 S1). 진도와 동경이의 계통군은 베트남과 중국 남부의 남아시아 개 품종과 밀접한 유전적 연관성을 보였다. 그러나 삽사리는 다른 한국 개들과 외집단을 형성하여 중국 북부 토착견 및 티베탄 마스티프와 유전적 유사성이 더 높다는 것을 나타냅니다. 놀랍게도 중국 남부 토착견과 베트남 토착견은 별개의 품종으로 명확하게 구별되지 않았습니다(그림 1A 및 S1). 티베탄 테리어와 퍼그는 페키니즈, 라사 압소, 시추와 같은 다른 아시아 개 품종과 별도의 클러스터를 형성했습니다. 대부분의 선사 시대 개는 유럽 품종으로 군집되었습니다 (그림 S1). 따라서 우리는 중복성을 줄이기 위해 나무에 멀리 군집된 선사 시대 개 24마리만 포함했습니다. 최대우도(ML) 트리도 구성되었으며(그림 S<>), UPGMA 트리에서 두 품종의 먼 클러스터링과 달리 ML 트리에서 Sapsaree와 Shiba가 낮은 신뢰도(부트스트랩 값 = <>%)로 클러스터링되었다는 점을 제외하고는 UPGMA 및 ML 트리의 결과가 일관되었습니다.
그림 1. 205 개 개체군과 야생 개과 동물의 24 개체의 게놈 관계 및 개체군 구조
(A) 184마리의 현대 개과 개체 사이의 IBS 거리는 UPGMA를 사용하여 클러스터링되었습니다. 품종 당 최대 <> 명의 개체가 시각화되었습니다. 유전적 거리는 왼쪽에 표시됩니다.
(B) 야생 개과 동물이 없는 23종의 개 품종에 대한 주성분 분석.
(C) 유전 구조 및 혼합 패턴. 148마리의 개과 동물에 대한 최대 가능성 기반 혼화제 분석은 2에서 8 사이의 가상 클러스터(K) 수를 사용하여 수행되었으며 다른 색상을 사용하여 표시되었습니다. 계통수에 사용되는 것과 동일한 개체가 제시됩니다. 혼합 패턴은 왼쪽에 있는 계통수의 개체군에 해당합니다.
(D) 11,443,767 SNP에 대한 개체의 근친 교배 계수에 대한 상자 그림. AFGH, 아프간 하운드; BRDC, 비어드 콜리; BOUV, 부비에 데 플랑드르; 브리아, 브리어드; 코이트, 코요테; 동경이; GSD, 저먼 셰퍼드; 그레, 그레이하운드; GRWF, 회색 늑대; HIWF, 히말라야 늑대; IDNS, 인도네시아 토착 개; 진도진드; LABR, 래브라도 리트리버; LHAS, 라사 압소; NCHI, 중국 북부 원주민; NGSD, 뉴기니 노래하는 개; OESD, 올드 잉글리쉬 쉽독; 페키, 페키니즈; 퍼그, 퍼그; PWTD, 포르투갈 물개; SAP, 삽사리; SCHI, 중국 남부 원주민; 시브, 시바; 허스크, 시베리안 허스키; 시, 시추; TIBM, 티베탄 마스티프; TIBT, 티베탄 테리어; 그리고 베트남 토착 개 VIET. 그림 S1, S2, S3, S4, 표 S3, S4 및 S5도 참조하십시오.
아시아 개 품종 간의 유전적 관계는 외집단이 있거나 없는 전체 품종 데이터 세트를 사용하여 수행된 주성분 분석(PCA)에서 보다 명확하게 분석되었습니다(그림 1, B 및 S2). 코요테를 외집단으로 하는 PCA 플롯에서 개 품종은 회색 늑대와 포르투갈 물개 사이의 계통에 널리 분포되어 있었는데, 뉴기니 노래하는 개, 딩고, 남부 중국 토착 개, 베트남 토착 개, 인도네시아 토착 개가 늑대에 가장 가까웠습니다(그림 S2A). 코요테 외집단이 없으면 포르투갈 물개와 뉴기니 노래하는 개는 외집단이 있는 결과보다 다른 개 품종과 더 멀리 떨어져 있었습니다(그림 S2B). 사사리와 티베탄 마스티프 및 시베리안 허스키의 밀접한 유전적 관계는 계통수보다 PCA에서 더 명확하게 묘사되었습니다(그림 1A 및 1B). 대조적으로, 다른 한국 품종인 동경이와 진도, 그리고 일본 토종 품종인 시바는 삽사리보다 베트남 토착견과 중국 남부 토착견에 더 가까운 거리를 일관되게 보였다. 따라서 한국 개 품종은 남아시아 혈통과 북아시아 혈통의 두 조상 혈통의 후손일 수 있습니다. 중국 장난감 개 (Pekingese 및 Shih Tzu)와 Lhasa Apso 및 Tibetan Terrier를 포함한 티베트 품종은 PCA 플롯에서 비교적 독특한 Pug를 제외하고는 유럽 품종에 가깝습니다 (그림 1B). 티베탄 마스티프는 다른 티베트 품종과 멀리 떨어져 있었는데, 이는 같은 지역에 여러 혈통이 존재함을 보여주는 한국 토착 견종 간의 관계와 유사하며, 이는 가까운 지리적 경계 내에서 조상 또는 유전적 다양성이 존재함을 나타냅니다.
한국과 동아시아 토종 개의 개체군 분화와 혼합 패턴
허드슨 페어와이즈 F를 이용한 이종 간 유전적 분화세인트 11,443,767개의 상염색체 SNP를 사용하여 코요테, 회색 늑대, 히말라야 늑대, 딩고 및 뉴기니 노래하는 개와 함께 24개의 개 개체군에 걸쳐 계산되었습니다(그림 S3). 이 연구의 모든 개 개체군 중에서 F세인트 중국 남부 토착견과 베트남 토착견 사이에서 가장 낮았다(F세인트 = 0.016), 지리적으로 가까운 지역에 거주하기 때문에 공통 조상 및/또는 혼혈의 영향을 시사합니다. 마찬가지로 F세인트 뉴기니 노래하는 개와 인도네시아 토착견, 베트남 토착견, 진도, 동경이와 같은 남아시아 또는 동아시아 개 사이의 값은 F의 차이를 보였다세인트 > 0.25 대 F세인트 이들과 중국 북부 토착견 사이의 값은 서로 다른 조상의 지리적 영향을 반영할 수 있습니다(그림 S3 및 표 S3).
흥미롭게도 F세인트중국 남부 토착견과 동경이 또는 진도 사이는 중국 남부 토착견과 삽사리(0.051)보다 낮았다(각각 0.090 및 0.130). Sapsaree는 모든 쌍별 비교 중에서 북부 중국 토착 개(0.101)와 가장 낮은 개체군 분화를 보였습니다. 더 에프세인트 중국 남부와 베트남 토착견, 북부와 남부 중국 토착견 사이의 값은 각각 0.015와 0.060이었다. 일본 Shiba는 약간 더 높은 F 범위를 보여주었습니다세인트 진도, 중국 북부 토착견, 중국 남부 토착견 (0.152–0.157). 남아시아 혈통이나 남아시아 또는 동아시아 혈통과 밀접하게 밀집된 베트남 토착견, 중국 남부 토착견, 진도, 동경이는 >0.05 낮은 F를 보였다세인트 코요테보다 뉴기니 노래하는 개와 함께 (표 S4). 대조적으로, 유럽 개 품종은 약간 낮은 F를 보였다세인트 뉴기니의 노래하는 개보다 코요테와 함께, 이전 그룹의 반대 경우. 이것은 특히 동남아시아 및 동아시아 혈통에 대한 지리적 영향을 반영할 수 있습니다. 그러나 유럽 품종의 경우 그 차이가 너무 작아 의미있는 결과로 해석 할 수 없었습니다. 이러한 결과는 동아시아 토착견이 유전적으로 분리되지 않았음을 나타냅니다. 뉴기니 노래하는 개는 해양 계통의 대표적인 개체군으로서 모든 품종 중에서 중국 남부 토착견과 베트남 토착견 모두 개체군 차이가 가장 적었고(0.351), 뉴기니 노래하는 개와 진도 사이의 가치도 다른 개 품종(0.381-0.406)에 비해 상대적으로 낮았다(0.651).
PCA의 클러스터형 품종은 PCA 및 계통수 분석에 사용된 개체로부터 1,483,785개의 SNP를 사용한 ADMIXTURE 분석을 사용하여 추가로 분류되었습니다(그림 1A-1C). 최적의 클러스터 수는 교차 유효성 검사 오류에서 4개로 결정되었습니다(그림 S2). K = 3와 1에서 개과 동물은 야생 개과 동물과 개로 나뉘었고 야생 개과 동물의 기여도는 유럽 개보다 아시아 개에서 더 높습니다. 계통수(그림 3A)의 개체군 클러스터링은 K = 4에서 각 개체군에서 유럽 및 뉴기니 노래하는 개 혼합물의 상대적인 양과 유의하게 일치했습니다. 페키니즈와 시추는 K = 5와 5에서 분화되었으며, 티베탄 테리어, 라사 압소, 아프간 하운드 및 기타 아시아 개체군을 포함한 다른 아시아 개 품종에서 다양한 정도의 혼합이 관찰되었습니다. K = 6에서 뉴기니의 노래하는 개는 나머지 개와 명확하게 구별됩니다. 그러나 진도, 중국 남부 토착견, 베트남 토착견에 대한 혈통의 미미하지만 눈에 띄는 영향이 관찰되었습니다. 퍼그는 K=7에서 다른 개체군과 구별되었고, K=8과 2에서 각 개체군에 대해 더 복잡한 개체군별 패턴이 관찰되었는데, 한국 토종 품종 중 진도의 혼합 패턴은 중국 남부 및 베트남 토착견의 혼합 패턴과 가장 유사했습니다. Sapsaree, 중국 북부 토착 개, 티베탄 테리어 및 시베리안 허스키의 혼합 패턴은 K = 5-<>에서 유사했습니다. 분석된 혼합 패턴은 계통발생학적 및 PCA 분석의 결과와 일치하였다.
토종 또는 토착 아시아 개의 유전적 다양성이 품종 개보다 더 높습니다.
개 개체군의 유전적 다양성은 현대 품종 데이터 세트를 구성하는 개 개체군에 대한 근친 교배 계수(F)로 평가되었습니다(그림 1D 및 표 S5). 각 품종에 대해 24-3 개체 (평균 22.5)로 구성된 9 개 개체군과 11 개의 야생 개과 동물의 근친 계수는 443,767,0 SNP를 기준으로 계산되었습니다. 흥미롭게도 한국의 두 품종인 동경이와 진도는 모든 품종 중에서 가장 낮은 F(각각 중앙값 F = 080.0 및 095.0)를 보인 반면(중앙값 F = 080.0–519.0), 뉴기니 노래하는 개는 가장 높았습니다(중앙값 F = 804.<>), 이는 뉴기니의 고원 고원에 사는 두 마리의 야생 동물이 분석에 포함되었지만 창시자 개체수가 매우 적기 때문일 가능성이 큽니다.15 삽사리는 또한 상대적으로 낮은 F(중앙값 F = 0.194)를 보였으며, 이는 중국 남부 토착견(중앙값 F = 0.183)과 유사하고 티베탄 마스티프(중앙값 F = 0.289)를 제외하고 중국과 유럽의 품종 개(중앙값 F = 0.519–0.145)보다 낮습니다. 중국과 유럽 개 품종을 포함한 품종 개의 높은 근친 계수 (중앙값 F = 0.289-0.519)는 각 개 개체군의 유전 적 다양성이 품종 형성 과정에서 선택 과정에 의해 크게 영향을 받는다는 것을 나타냅니다. 번식 이력이 긴 것으로 알려진 퍼그는 이 연구에서 분석된 모든 아시아 개 품종 중에서 가장 높은 F(중앙값 F = 0.416)를 보였지만 샘플 목록에서 혈연 관계가 없는 개체를 선택적으로 사용했습니다. 게놈에서 <3kb 영역의 쌍별 거리에 대해 동일한 수의 개체(n = 300)를 사용한 혈통 불균형(LD) 붕괴 분석도 근친 계수와 높은 상관관계가 있었습니다(그림 S5).
서유라시아와 동남아시아 및 동아시아 조상 혈통을 한국 토종 개에 대한 침입
아시아 대륙과 한반도에 서식하는 국내 개의 인구 통계학적 역사를 연구하기 위해 TreeMix 프로그램을 사용하여 0마리의 개과 동물 10마리에 대해 139-19개의 철새 트랙을 허용하는 혼혈 분석을 수행했습니다(그림 2A). 가장자리가 혼합된 최대 가능성 트리에서 동아시아와 시베리아의 현대 개 혈통의 조상은 뉴기니의 노래하는 개와의 관련성에 따라 크게 두 개의 다른 혈통으로 추적할 수 있었습니다(그림 2A 및 S6). 마이그레이션 트랙 수가 다른 TreeMix 그래프 중에서 6개의 트랙이 있는 트리는 PCA 및 혼합 분석의 결과와 가장 밀접하게 일치하며, 이는 마이그레이션 에지가 없는 트리와 동일한 토폴로지를 보여주었습니다(그림 S7). 그 결과는 해양 혈통의 유전적 침입이 중국 남부 및 북부 토착 개인 시바(Shiba)와 한국 토착 품종에 큰 영향을 미쳤음을 나타냅니다. TreeMix 분석에서 추정된 잔차에 기초하여, 그래프에서 잔차의 적합도는 크기가 시각화된 나무 토폴로지보다 베트남 토착 개 및 뉴기니 노래하는 개와 더 밀접하게 관련될 수 있다는 것입니다(그림 S<>).
그림 2. 동 유라시아 개의 혼합 그래프
(A) 최대우도 그래프는 컬러 화살표로 표시된 8개의 이동 에지로 추론되었습니다. 유전 구조와 지질 학적 기원의 유사성에 따라 3 개의 clade가 표시되었습니다. 각 클레이드에는 동그라미 숫자가 표시되어 있습니다. (B) 외집단 f의 묘사3-회색 늑대(GRWF)를 공통 조상으로 하는 북부 중국 토착견(NCHI) 및 남부 중국 토착견(SCHI)에 대한 각 품종("X")에 대한 통계. 대각선으로부터의 거리는 위쪽 대각선 영역의 NCHI 또는 아래쪽 대각선 영역의 SCHI 품종에 대한 조상의 왜도를 나타냅니다. 그림 S6, S7 및 S8도 참조하십시오.
혼혈 나무에서 조상 혈통은 하위 혈통으로 분화되어 4개의 계통군을 형성했습니다. 클레이드 I은 남부 중국 토착 개, 베트남 토착 개, 뉴기니 노래하는 개로 구성되었습니다. clade II는 한국 토종 개 품종과 일본 품종 인 Shiba로 구성되었습니다. clade III는 남부 중국 토착 개를 제외하고 티베트와 중국 품종으로 구성되었습니다. 시베리안 허스키는 클레이드 IV를 형성합니다. 히말라야 늑대에서 뉴기니 노래하는 개에 이르기까지, 뉴기니 노래하는 개로 대표되는 해양 혈통에서 세 가지 계통 모두에 이르기까지, 중국 장난감 품종의 조상에서 삽사리에 이르기까지 세 가지 주요 침입 경로가 예측되었습니다. 뉴기니 노래하는 개 혈통에서 각 계통으로의 5 개의 이동 가장자리는 이주 가중치를 고려할 때 계통 I 및 II의 개가 다른 계통보다 혈통의 영향을 더 강하게 받았다는 것을 나타냅니다. 이것은 또한 아웃 그룹 f에 의해 지원되었습니다3-뉴기니 노래와 클레이드 II에서 남부 중국 토착견 사이의 유전적 드리프트를 공유하는 통계(그림 S8). 시바, 진도, 동경이, 베트남 토착견, 뉴기니 노래하는 개 사이의 형태학적 유사성은 개체군 간의 조상 관계의 존재와 해양 혈통의 유전자 플럭스의 유입에 기인할 수 있습니다(그림 S9).
아웃그룹 f3-통계는 F 형식의 외집단 집단에 비해 두 집단의 공유된 유전적 드리프트를 평가하는 데 사용할 수 있습니다.3 (외집단, 인구 1, 인구 2). 외집단 f에서3 F 분석3 (회색 늑대; 뉴기니 노래하는 개, 기타 품종)은 유럽 14종과 아시아 8종 중 진도, 동경이, 시바, 중국 남부 토착견, 베트남 토착견 등이 다른 견종과 차별화되었으며, 삽사리는 <>개 품종과 나머지 품종 사이에 있었다(그림 S<>). 이는 중국 남부 토착견, 뉴기니 노래하는 개, 베트남 토착견, 시바, 동경이, 진도가 다른 테스트 품종보다 조상이 더 유사함을 나타냅니다. 외집단 f3-통계는 또한 Sapsaree와 Tibetan Mastiff 사이의 유전적 유사성을 나타냅니다. 이 결과는 아웃그룹 f와 함께3-중국 남부 및 북부 토착견에 대한 통계는 한국 토종 개들 사이에서 동경이(Donggyeongi)와 진도(Jindo) 그룹과 삽사리(Sapsaree) 사이의 조상 혈통의 차이를 나타냅니다(그림 2B). 따라서 동경이와 진도는 서유라시아 혈통과 더 관련이 있는 삽사리보다 해양 혈통과 더 관련이 있으며, Bergstrom 등이 지적한 전 세계 개 조상과 일치합니다.1 우리는 중국 남부, 베트남, 한국, 일본에 서식하는 뉴기니의 노래하는 개 관련 유전 구조를 가진 원주민 인구의 조상을 동 남아시아 및 동아시아(SEA) 혈통으로, 유럽 품종의 유전적 구성이 큰 같은 지역의 원주민 인구의 조상을 서유라시아(WE) 조상으로 명명했습니다.
혼혈 분석(표 S6)에서 계통군 II에 속하는 품종에 대한 SEA 및 티베탄 테리어 혈통의 기여 비율을 qpAdm을 사용하여 계산했을 때, SEA 조상은 티베탄 테리어 조상보다 진도, 동경이, 시바(81.8%-93.2%)에서 더 높았다. 대조적으로, Sapsaree는 SEA와 Tibetan Terrier 조상의 각각 47.3 %와 52.7 %와 혼합되었습니다. 아시아 개 품종에 대한 SEA 및 WE 조상의 유입을 각각 중국 남부 토착 개와 독일 셰퍼드를 각 혈통의 대표 개체군으로 분석했을 때 뉴기니 노래하는 개와 베트남 토착 개는 완전히 SEA 조상으로 구성되었습니다(그림 3 및 표 S7). 마찬가지로 진도, 시바, 동경이도 각각 동남 혈통의 94.5%, 92.0%, 85.5%를 차지했다. 중국 북부 개와 티베탄 마스티프에 대한 WE 혈통의 비율은 각각 38.4%와 23.9%였다. Sapsaree는 SEA의 59.6%와 WE 조상 혈통의 40.4%에 의해 기여되었습니다(그림 3 및 표 S7). 시베리안 허스키는 사프사리와 비슷한 혼합 비율을 보였다. 티베탄 테리어, 라사 압소, 페키니즈 및 퍼그는 WE 혈통의 상당 부분 (67 % -100 %)으로 구성됩니다.
그림 3. 동남아시아 및 동아시아 및 유라시아 조상의 아시아 개 조상의 상대적 비율
동남아시아 및 동아시아(SEA) 및 서유라시아(WE) 조상의 조상 비율은 남부 중국 토착 개와 저먼 셰퍼드를 소스 개체군으로 채택하고 코요테, 회색 늑대, 히말라야 늑대 및 스웨덴 Frälsegården에서 발견된 5,000년 된 개 게놈을 외집단 개체군으로 채택한 가장 적합한 qpAdm 모델에 의해 추정되었습니다. 표 S6 및 S7도 참조하십시오.
Sapsaree와 다른 서양 및 아시아 품종이 Jindo 및 Donggyeongi보다 더 큰 일배체형 공유
26마리의 아시아인과 14마리의 유럽인 개체군을 포함한 15마리의 개과 동물과 늑대가 있는 삽사리, 진도, 동경이, 중국 남부 토착견의 게놈 전체 공유 일배체형 길이는 상염색체에서 202,681,4개의 단계적 SNP를 사용하여 추정되었습니다(그림 4). 개체군 내 공유 일배체형 길이는 극단 F에서 예상한 바와 같이 뉴기니에서 노래하는 개에서 가장 컸습니다(그림 169A). 야생 개과 동물을 제외한 다른 품종과 다른 품종 간의 공유 일배체형 길이의 평균 평균값은 진도, 동경이 및 중국 남부 토착견의 경우 각각 00.142, 06.126 및 55.189 Mbp였으며, 이는 다른 품종에 대한 삽사리(평균 48.4 Mbp)의 일배체형 공유가 더 높다는 것을 강조합니다(그림 4B). 대조적으로, 중국 남부 토착견은 다른 품종보다 일배체형 공유가 가장 낮았고 뉴기니 노래하는 개, 베트남 토착견 및 진도와 더 높은 일배체형 공유를 보였다(그림 10C). 분석된 아시아 개 품종 중 Sapsaree는 저먼 셰퍼드와 가장 높은 일배체형 공유(그림 S4)를 보였고 아프간 하운드 및 뉴기니 노래하는 개(그림 <>D)와 가장 낮은 것으로 나타났으며, 이는 고대 유럽 조상이 Sapsaree와 혼합되었음을 나타냅니다.1 진도의 경우, 동경이(Donggyeongi)와 삽사리(Sapsaree)가 가장 많았지만, 아프간 하운드(Afghan Hound)가 가장 낮았다(그림 4E). 이러한 결과는 계통발생학, PCA 및 혼화제 분석의 결과와 일치합니다. 이 연구에서 WGS 데이터에서 각 품종에 대해 추정된 공유 일배체형 길이는 SNP 칩을 사용하여 유전형 데이터를 사용한 이전 연구에서 결정된 것보다 약간 더 컸습니다.16
그림 4. 다른 개 개체군에 걸친 한국 토종 품종의 일배체형 공유 양
상자 그림은 상염색체에서 (A) 동일한 품종과 (B) 다른 품종의 두 개 간에 공유되는 일배체형 길이의 분포를 보여줍니다. (C) 중국 남부 토착견, (D) 삽사리, (E) 진도, (F) 동경이에 대한 다른 품종과 공유된 일배체형 길이가 y축에 표시됩니다. 품종 이름은 x축에 표시됩니다. 그림 S10도 참조하십시오.
한국 토종 품종을 포함한 아시아 개 개체군의 예상 분기 시간
한국의 500개 토착품종인 삽사리, 진도, 동경이를 포함한 000개의 동아시아 개 품종의 발산 시간을 추정하기 위해 303,488개의 이중대립유전자 SNP를 사용하여 1,276개의 마르코프 사슬 몬테카를로 반복으로 SNAPP 분석을 수행했으며, 중성 영역(크기 974,635,15bp)에서 SNP 간 거리의 최소 길이는 35kb였습니다. 개와 늑대 사이의 정확한 발산 시간은 다소 논란의 여지가 있기 때문에 근본 제약이 있는 한국 토종 개의 발산 시간을 각각 <>,<>년 전(kya)으로 추정했습니다. 우리는 분석에서 아시아 개의 여러 가축화 사건과 세계의 다른 지역으로의 이동을 고려하지 않았습니다.
노드 연령을 15kya로 가정했을 때, 아시아 개 혈통에서 유럽 조상을 대표하는 German Shepherd의 분기 시간은 ∼6.78kya(95% 최고 후방 밀도(HPD): 6.68–6.89kya)로 추정되었습니다(그림 5A). 그 후, 티베탄 마스티프는 다른 아시아 토착 개 품종 ∼5.98 kya (95 % HPD : 5.89-6.09 kya)보다 먼저 분기되었습니다. 한국 개 품종 중 삽사리는 티베탄 마스티프 계통 4.66 kya (95 % HPD : 4.56-4.74 kya)에서 분기되었습니다. 진도와 동경이는 중국 남부 토착견 (2 % HPD : 60.95-2.45 kya)의 경우 ∼2.67 kya의 차이 이후 3.00 kya (95 % HPD : 2.93-3.08 kya)로 가장 최근의 차이를 보였다. 노드 수명이 35kya라고 가정하면 트리 토폴로지는 일관되었지만 모든 노드의 발산 시간은 2.33배 증가했습니다(그림 5B).
그림 5. 아시아 개의 발산 시간
SNAPP를 사용하여 500,000 MCMC 반복으로 발산 시간을 예측했습니다. 분석의 근본 연대는 15,000년(A)과 35,000년 전(B)으로 제한되었습니다. 95 %의 가장 높은 후방 밀도와 함께 대략적인 발산 시간이 각 노드에 표시됩니다. (C) PSMC를 이용한 삽사리와 진도의 유효 개체군 규모 추정.
또한, 4.0 × 10의 돌연변이율을 사용하여 쌍별 순차 마르코비안 유착(PSMC) 분석을 수행하였다−9 (그림 5C). 회색 늑대의 유효 개체군 크기의 차이는 개와의 차이가 적어도 약 30kya보다 더 오래되었을 수 있음을 보여주었습니다. 유사하게, 진도와 삽사리는 유효 개체군 규모가 ∼2 kya에서 증가한 것으로 나타났습니다. PSMC의 결과는 SNAPP에 사용된 두 가지 근 연령 중 어느 것이 다른 것보다 더 가능성이 높은지 뒷받침하는 데 결정적이지 않습니다. 따라서 PSMC와 SNAPP 분석 결과를 모두 고려하여 삽사리와 다른 한국 품종 간의 발산 시간은 2에서 11 kya 사이로 결정되었습니다.
토론
여러 연구에서 전 세계적으로 개 조상에 대한 집단 유전 분석 결과가 보고되었습니다.1,2,4,6,14,16,17 그러나 동아시아와 한반도의 토종 견종 간의 개체군 관계는 철저히 조사되지 않았다. 한국 토종 개 품종과 다른 아시아 개 개체군의 조상 및 계통발생학적 관계에 대한 이해를 높이기 위해 이 연구에서 새로 시퀀싱된 동북아시아 개 205마리와 공개적으로 이용 가능한 개 게놈 25개를 포함하여 186마리의 개과 동물의 게놈 데이터를 사용하여 개체군 유전 분석을 수행했습니다. 우리의 결과는 한국 토종 개 품종이 두 개의 다른 조상으로 나뉘며 뉴기니 노래하는 개로 대표되는 SEA 혈통에 의해 차별적으로 혼합되었음을 보여주었습니다. PCA 및 TreeMix 분석에서 상대적으로 밀접한 군집화와 몇몇 한국, 일본, 남부 중국, 베트남 토착 및 뉴기니 노래하는 개 사이의 형태학적 출현의 유사성은 아마도 아시아 및 오세아니아 개의 초기 역사 동안 이주 사건에 의한 공통 유전적 조상 또는 교잡을 나타냅니다(그림 1 및 3 ). 이 연구와 다른 연구에서 일반적으로 평가된 개 품종의 계통발생학적 관계는 일치했습니다.
현미부수체 및 고밀도 SNP 어레이 유전형 분석을 이용한 한국 토종 개의 조상에 대한 선행 연구에서는 한국 토종 개 품종과 시베리안 허스키 또는 중국 품종 사이에 밀접한 유전적 관계가 있음을 시사했습니다.12,18 그러나 결과는 특히 동아시아 개의 경우 유전자좌 또는 품종의 수에 의해 다소 제한되었습니다. 한국 토종 개와 다른 아시아 토종 품종의 유전적 관계에 대한 우리의 결과는 한국 토종 개가 삽사리와 같은 WE 혈통 관련과 동경이 및 진도를 포함한 SEA 혈통 관련의 두 하위 그룹으로 분화될 수 있음을 일관되게 나타냅니다. 또한, 본 연구에 포함되지 않은 제주, 풍산 등 다른 한국 토종 견종들도 동경이, 진도와 형태학적 유사성을 고려할 때 동해계통과 관련이 있을 수 있다고 추측한다. 흥미롭게도 게놈 전체의 일배체형 공유 분석 결과는 사사리와 저먼 셰퍼드 사이에 가장 큰 일배체형 공유가 나타났습니다(그림 4). 이전 연구에서는 독일 셰퍼드와 많은 수의 개 품종이 혼합 될 것으로 예측했습니다.1 Sapsaree에 대한 WE 혈통의 도입을 지원합니다. 또한 PCA 및 아웃그룹 f3-통계에 따르면 SEA 계통 유형의 한국 품종, 베트남 토착견, 일본 토착 품종인 시바, 뉴기니 노래견 사이에 밀접한 관계가 있는 것으로 나타났으며, 이는 TreeMix 분석에 의해 뒷받침된 이러한 개과 동물에 대한 해양 혈통의 침입 가능성을 시사합니다(그림 2A 및 S8).
Bergstrom et al. (2020)은 선사 시대 개를 포함한 대규모 WGS 데이터를 사용하여 전 세계적으로 개의 포괄적인 조상을 보여주었습니다.1 그들의 연구에서, 그들은 몇몇 현대 중국 개 개체군이 뉴기니 노래하는 개와 서 유라시아 개와 관련된 개체군 사이의 혼합의 산물이라는 증거를 보여 주었다. 그들은 또한 진도, 시바, 베트남 토착 개에서 뉴기니 노래하는 개 조상의 비율이 높고 시베리아 인구에서 뉴기니 노래하는 개 관련 조상이 없거나 최소한이라고 보고했습니다. 이러한 결과와 유사하게, 우리는 동경이와 진도 모두에서 상당한 양의 중국 남부 토착 개가 혼합되어 있음을 발견했습니다(표 S7). 그러나 우리는 다른 두 한국 품종보다 티베탄 마스티프와 시베리안 허스키와 더 밀접하게 밀집된 삽사리에서 뉴기니 노래하는 개의 혼합이 훨씬 적은 것을 관찰했습니다(그림 3). 이는 아시아에서 바이칼과 뉴기니의 노래하는 개 관련 조상이 > 7kya에서 분리될 것으로 예측한 이전 연구의 결과와 일치합니다.1 삽사리와 다른 한국 토종 개들의 조상 차이는 이 가설로 설명할 수 있다.
또한 Sapsaree는 <5kya에서 발생하는 대초원 관련 조상의 확산에 영향을 받았을 수 있으며 티베탄 마스티프와 시베리안 허스키에서도 상당한 양의 대초원 관련 조상 혼합이 발견되었습니다.1 우리의 결과는 Sapsaree가 Tibetan Mastiff 및 Siberian Husky와 유사한 혼합 패턴을 나타냄을 나타냅니다(그림 1C).
고대와 현재의 인간 게놈 염기서열을 분석한 한국 민족의 기원과 구성에 관한 최근 연구에 따르면 한국인의 기초는 현재보다 약 5,000-4,000년 전에 철기 시대 캄보디아인과 관련된 고대 남부 중국 인구와의 급속한 혼합을 통해 확립되었을 수 있다고 추론했습니다.19 이는 이 연구에서 예측된 지역 토착견의 유전적 관계와 일치하는 것으로 보입니다. 뉴기니 노래하는 개와 관련된 해양 혈통의 침입은 또한 인간의 이주와 관련이 있을 수 있습니다.
이전 연구에서는 Sapsaree의 조상이 티베탄 테리어 및 Lhasa Apso와 관련이 있을 수 있다고 추측했습니다.13 그러나 우리의 연구에 따르면 Sapsaree는 Tibetan Terrier 및 Lhasa Apso보다 Tibetan Mastiff 및 Siberian Husky와 더 밀접한 관련이 있으며, 이는 Sapsaree와 Tibetan Mastiff 사이의 개 백혈구 항원 클래스 II 유전자의 더 높은 일배체형 공유에 의해 뒷받침 됩니다.20 최근에, 우리는 이전에 보고된 가구 돌연변이와 동일한 RSPO167 2′ UTR의 3bp 반복 서열 삽입이 Sapsaree의 긴 머리 표현형을 담당하고 있으며, 모발 길이 관련 RSPO2 돌연변이는 긴 머리를 가진 모든 현대 개 품종에서 동일합니다.20 이것은 Treemix 분석에서 티베탄 테리어와 삽사리 사이의 혼합을 예측한 결과와 일치합니다(그림 2A). 낮은 인구 분화(F세인트) 한국 토종 품종 중 한국 토종 견종 간의 유전자 흐름을 시사하거나 분리되지 않았습니다. 그러나 혼혈 분석 결과 삽사리의 유전 구조는 다른 한국 토종 품종보다 더 복잡한 것으로 나타났습니다(그림 1C).
고고학적 증거는 오세아니아에서 약 3.5kya로 개가 존재했음을 뒷받침합니다.21 남아시아 개에 대한 해양 이동의 영향은 다른 연구에서보고되었습니다.6 뉴기니의 노래하는 개 혈통에서 동경이와 진도 및 일본과 베트남의 다른 품종으로의 이동도 관찰되었습니다. 뉴기니 노래하는 개는 유전적으로 딩고(C. lupus dingo)와 유사하지만 오세아닉 개과 동물의 뚜렷한 진화 혈통 내에서 뚜렷한 개체군을 나타냅니다. 최근 연구에 따르면 뉴기니와 베트남의 마을 개는 게놈 일배체형의 13%와 11%를 뉴기니의 노래하는 개와 공유합니다.6 한반도가 서유라시아와 남아시아 혈통에서 유래한 토착 품종을 품고 있다는 발견은 흥미롭고, 한반도에 서로 다른 조상이 여러 번 유입되었음을 시사합니다. 그러나 대안적으로 점진적인 분화와 거리에 의한 분리(인접 지역으로부터의 차등적인 유전자 흐름과 함께)가 유럽인과 뉴기니의 노래하는 개와 같은 조상 사이에 관찰된 혼합 패턴을 생성했을 것이라는 것도 그럴듯합니다.
여러 연구에서 동아시아 개에서 다른 지리적 기원의 개보다 더 높은 수준의 핵 및 미토콘드리아 게놈 다양성이 보고되었으며, 이는 국내 개의 동아시아 기원을 뒷받침하는 증거로 작용합니다.4,14 Wang et al. (2016)은 개의 유전적 다양성이 훨씬 더 높다는 점을 근거로 약 33,000년 전에 국내 개의 동남아시아 기원을 제안했습니다.4 흥미롭게도 근친교배 계수와 연계 불균형에 의해 추정된 유전적 다양성 수준은 다른 동아시아 품종보다 한국 토종 품종에서 더 높았다(그림 1D 및 S5). 한반도 토종 개의 유전적 다양성이 증가한 것은 서유라시아 및 오세아니아 혈통과 같은 여러 혈통이 한반도에 도입되었기 때문일 수 있습니다. 그러나 이것은 또한 현대 개의 조상 혈통이 갈라졌을 때 현재 한반도의 서해안이 아시아 대륙과 인접해 있었다는 점을 고려할 때 한국 토종 품종의 초기 역사 때문일 수도 있습니다. 다른 아시아 지역의 토착 개들의 게놈 염기서열을 사용한 추가 연구는 아시아 개들 사이의 계통발생학적 관계와 유전자 흐름을 이해하는 데 크게 기여할 것입니다.
토착 아시아 품종의 더 높은 유전적 다양성과 일치하여, 그들의 게놈은 더 낮은 LD를 나타냈습니다(r2) 품종 개보다 아시아 토착 품종의 역사에서 인구 규모가 컸던 때가 있었음을 나타냅니다. 세 가지 한국 토종 개 품종은 모두 제한된 수의 개체에서 복원되었습니다.18,22,23 이전 연구에서 Sapsaree의 높은 유전적 다양성은 큰 유효 개체군 크기(Ne) 인구 감소 및 복원 전에.13,24 우리의 분석에서, 추정된 Ne 중국 남부 토착견에서 가장 컸고, 다른 토착 아시아 품종에서 그 뒤를 이었고, 뉴기니 노래하는 개에서 가장 낮았다(그림 S11).
추정된 발산 시간은 적용된 방법 및 파라미터에 따라 달라질 수 있습니다. 늑대와 개 사이의 분기 날짜는 이전 연구에서 35,000에서 15,000 사이로 추정되었습니다.4,10,25 따라서 우리는 각각 두 시점을 사용하여 SNAPP 분석을 수행했습니다. 발산 시간 트리의 구조는 그림 1 A의 IBS 거리를 기반으로 한 계통 발생 트리의 구조와 일치했습니다. 우리가 아는 한, 이것은 다른 아시아 개와 함께 한국 토종 개 혈통의 분기 시간을 추정하려는 첫 번째 시도입니다.
요약하면, WGS 데이터의 개체군 유전자 분석을 통해 티베트, 중국, 한국, 일본, 베트남, 뉴기니 노래하는 개 개체군을 포함한 동아시아 개의 유전적 특성과 관계를 제시하였다. 우리의 결과는 아시아 개가 WE와 SEA 혈통의 유전 적 기여도에 따라 크게 두 그룹으로 나눌 수 있음을 보여주었습니다. 마찬가지로 삽사리는 주로 WE 조상과 관련이 있고 동경이와 진도는 SEA 조상과 관련이 있어 한국 토종 개 혈통의 기원과 역사를 묘사할 수 있었습니다. 따라서 우리의 결과는 아시아 대륙에서 개의 유전 역사와 조상 관계를 한반도까지 확장하고 남아시아와 동아시아 및 오세아니아 개 혈통 간의 유전적 관련성의 존재를 강조합니다. 동아시아 토착견 또는 토착견의 게놈에 대한 개체군 유전 분석 결과와 25가지 품종의 아시아 개 <>마리의 게놈 염기서열에 대한 새로 보고된 결과는 아시아 개의 기원과 이주 역사에 대한 새로운 통찰력을 제공합니다.
연구의 한계
본 연구에서는 대규모 전체 게놈 염기서열 분석 데이터를 기반으로 아시아 개와 그 조상의 유전적 관계를 분석하였다. 그러나 고대 개 DNA의 부족, 일배체형 추정의 어려움, 동아시아 토종 개의 제한된 품종 범위와 개체군 규모가 이 연구의 한계일 수 있습니다. 동아시아 개의 조상을 더욱 명확히 하기 위해서는 지리적으로 북한, 일본, 몽골, 시베리아를 포함한 한반도 근처 또는 그 안에 있는 토착 개의 추가 게놈이 필요할 것입니다.
★STAR 메서드주요 자원 테이블
시약 또는 자원근원식별자예치된 데이터소프트웨어 및 알고리즘
리소스 가용성리드 접점
리소스 및 시약에 대한 추가 정보 및 요청은 리드 담당자인 Chankyu Park(chankyu@konkuk.ac.kr)에게 전달되어야 하며 이에 의해 이행될 것입니다.
재료 가용성
이 연구에서 새로운 물질은 생성되지 않았습니다.
실험 모델 및 연구 참가자
시험관 내 DNA 추출을 위해 25 마리 의 삽사리, <> 마리의 진도, <> 마리의 티베탄 마스티프, <> 마리의 퍼그 및 <> 마리의 페키니즈로 구성된 총 <> 마리의 성견으로부터 혈액 샘플을 채취했습니다. 각 동물은 수의사의 감독하에 위생적인 우리에 수용되었습니다. 연구 전반에 걸친 분석에서 성염색체를 제외했기 때문에 결과는 성별의 영향을 받지 않았습니다.
방법 세부 정보동물 및 DNA 준비
건국대학교 기관동물관리이용위원회(IACUC)의 프로토콜에 따라 한국 경산의 삽사리연구재단과 한국 진도의 진도견테마파크에서 각각 15개의 삽사리와 300개의 진도의 혈액 샘플을 채취했다. 티베탄 마스티프 <>마리, 페키니즈 <>마리, 퍼그 <>마리를 포함한 중국 개 <>마리의 혈액 샘플을 길림대학교 IACUC에서 승인한 프로토콜을 사용하여 수의사가 채취했습니다. 제조사의 프로토콜에 따라 ExgeneTM Blood SV mini (GeneAll Biotechnology, Seoul, Korea) 또는 DNeasy Blood & Tissue kit (Qiagen, MD, USA)를 사용하여 <> μL의 전혈로부터 Sapsarees 및 Jindos의 게놈 DNA를 분리하였다.
전체 게놈 염기서열 분석 및 변이체 분석
Covaris S2 기기(Covaris, MA, USA)를 사용하여 6000마이크로그램의 게놈 DNA를 전단하고 제조업체의 프로토콜에 따라 DNA PCR-Free Library 준비 키트(Illumina, CA, USA)를 사용하여 쌍단 DNA 시퀀싱 라이브러리를 준비했습니다. WGS는 NovaSeq 186 기기(Illumina)를 사용하여 수행하였다. 또한, 2개 개과 동물의 전체 게놈 서열은 fasterq-dump v10.8.1을 사용하여 NCBI SRA 데이터베이스로부터 다운로드되었다(표 S3). 판독은 BWA MEM v1.000002285.3-r0을 사용하여 개 참조 게놈 CanFam7.17(RefSeq 수탁 번호 GCF_1188.<>)에 매핑되었습니다.26 매핑된 읽기는 samtools v1.10을 사용하여 바이너리 형식으로 변환되었습니다.27 PCR 중복은 Picard MarkDuplicates v2.21.3을 사용하여 표시되었으며,46 기본 품질은 게놈 분석 툴킷(GATK) 패키지 v4.1.9.0에서 BaseRecalibrator 및 ApplyBQSR을 사용하여 재보정되었습니다.28 샘플별 게놈 변이체는 GATK HaplotypeCaller를 사용하여 호출되었으며,47모든 개체의 변이체는 GATK GenomicsDBImport를 사용하여 통합되었으며 GATK GenotypeGVCF를 사용하여 공동 변이체를 만들었습니다. 높은 가닥 편향(Fisher Strand(FS) > 30.0), 낮은 품질(QD(QualityOfDepth) < 2) 및 높은 복잡성을 갖는 변이체(여기서 35개의 SNP는 35bp 창 내에 배치됨(-창 3 -클러스터 3)), GATK VariantFiltration을 사용하여 제거되었습니다. 삽입 및 삭제(INDEL)는 GATK SelectVariants를 사용하여 변형에서 제거되었습니다. 선사 시대 개 변종을 호출하기 위해 PMDtools v.0.60을 사용하여 사후 손상(PMD 점수 <<>)이 있는 판독값을 제거했습니다.29 Picard 및 GATK를 사용하는 후속 프로세스는 다른 샘플의 변형을 호출하는 것과 동일합니다. 선사 시대 개 2 마리와 현대 개과 개체에서 각각 총 984,901,20 마리와 002,237,34 개의 SNP가 호출되었습니다. 공유 SNP는 bcftools isec(-n = 171 -w 2, 1) 및 병합을 사용하여 통합되었습니다.48
계통발생학적 분석
이중대립유전자 SNP는 Vcftools v0.1.17을 사용하여 선택되었습니다30 R v1.20.1에서 SNPRelate 패키지 v3.6.3을 적용받습니다.31 결손된 유전자형 비율이 >0.05이고 소대립유전자 빈도(MAF)가 <0.01일 때 SNP를 추가로 여과했습니다. IBS(Identity-by-State) 기반 쌍별 거리 행렬이 생성되어 UPGMA(Unweighted Pair Group Method with Arithmetic Mean) 클러스터링 방법을 사용하여 205명의 개인이 있는 계통수를 구성하는 데 사용되었습니다.31 주성분 분석(PCA)은 유전적 공분산 행렬을 계산하고 샘플 간의 상관 계수를 계산하는 snpgdsPCA 함수를 사용하여 수행되었습니다.31 최대우도 트리를 구성하려면, Vcf2phylip v2.833 116마리의 선사시대 개를 포함하여 017마리의 송곳니로부터 0,8개의 SNP(유전자형 비율>205.34)로 다중 서열 정렬을 생성하는 데 사용되었습니다. 시작 트리를 검색하기 위해 <>개의 무작위 최대 파시모니 트리가 생성되었습니다. 최대우도 트리는 GTR+I+G 모델로 구성되었습니다49 RAxML-NG v.1.1.0 사용32 50개의 부트스트랩 반복실험이 있습니다.
유전적 다양성 분석
근친 교배 계수(F)는 매개변수 '--het small-sample'과 함께 PLINK v11.443b767.171를 사용하여 1마리의 현대 개과 개체로부터 90,6,12개의 SNP를 사용하여 계산되었습니다.34 그 후, 품종 수준 F 는 동일한 개과 동물 그룹의 개별 F 값을 평균하여 계산되었습니다. LD 붕괴 분석은 PopLDdecay v0.05을 사용하여 동일한 SNP(오콜 <0.01 및 MAF >3.41)에 대해 수행하였다.35 허드슨의 페어와이즈 F세인트 파라미터 '--fst'와 함께 PLINK v2.00a3LM을 사용하여 계산되었습니다.34,50,51
혼합물 및 그래프 분석
148 개 품종 (n = 130-23)의 3 개체, 10 개의 뉴기니 노래 개, 1 개의 회색 늑대, 3 개의 히말라야 늑대 및 0 개의 코요테로 구성된 총 2 마리의 개과 동물을 ADMIXTURE v8.<>.<>을 사용하여 혼합 분석을 실시했으며, 가상의 클러스터 (K)는 <>에서 <>까지.36 pairwise r이 가장 큰 SNP 쌍을 선택하는 PLINK v50.10b0.1를 이용하여 '--indep-pairwise 1 90 6.12' 파라미터로 계산 부담을 줄이기 위해 연계 불균형 기반 가지치기를 수행하였다2 R을 통해 50KB 창 내에서2 임계값 0.1이고 단계 크기는 10개 변형입니다. 부트스트래핑을 1회 수행하고 각 가상 클러스터에 대해 교차 검증 오류를 계산했습니다. 혼화제 막대 플롯은 pong v4.9.<>를 사용하여 시각화되었습니다.37 이주 사건은 Treemix v139.19을 사용하여 시베리안 허스키, 뉴기니 노래하는 개, 회색 늑대, 히말라야 늑대 및 코요테를 외집단(-루트 코요테)으로 포함하여 126개 아시아 개 품종의 14개체로 구성된 1개 개 그룹의 13개체에 대해 분석되었습니다.38 0-10개의 마이그레이션 에지가 있는 최대 우도 그래프는 부트스트래핑(-bootstrap)과 함께 10,15,664개의 이중대립유전자 상염색체 SNP(-k 509)를 사용하여 10개의 SNP로 구성된 SNP 블록의 빈도로 생성되었습니다. 샘플 크기 보정은 수행되지 않았습니다. 그래프는 임의의 시드 번호(-seed)를 사용하여 각 에지 수에 대해 <>번 생성되었습니다.
아웃그룹 f3-통계 및 qpAdm 분석
f3-통계는 Admixtools v184.26.13 패키지에 포함된 qp793Pop 소프트웨어를 사용하여 410,0,05개의 이중대립유전자 SNP(유전형 분석률 <0.01 및 MAF>3.7 누락)를 기반으로 0개의 개과 동물에 속하는 2명의 개인에 대해 계산되었습니다.39 잭나이프 블록의 수는 327개였습니다. 혼합 비율은 Admixtools v1.372.698의 qpAdm v212 프로그램을 사용하여 1520개의 개과 동물로부터 7,0,2개의 상염색체 SNP로 계산되었습니다.39,52 코요테는 회색 늑대, 히말라야 늑대, 선사 시대 개 게놈 C88과 함께 기본 외집단 개체군으로 사용되었으며, 스웨덴 Frälsegården에서 5,000년 동안 발견되었습니다.1
일배체형 공유
184 현대 개과 동물의 일배 체형은 Beagle v15.725를 사용하여 060,0,01 SNP (MAF >0.05 및 누락 된 유전형 분석 속도 <5.2)로 단계적으로 처리되었습니다40 10Mb 슬라이딩 윈도우와 0.5Mb의 매개변수가 창 사이의 겹치는 길이입니다. 우리는 100개의 연속적인 SNP를 일배체형 블록의 단위로 정의했습니다. 두 개인 사이의 쌍으로 공유된 일배체형 길이는 개인 간의 동일한 일배체형 블록 길이의 평균 값으로 계산되었습니다.�ℎ����ℎ�������������ℎ=∑�11+�12+�21+�224어디 �나는�(나는,�=1��2) 위상 일배체형을 가진 두 개의 이배체 게놈 사이의 4가지 가능한 경우 중 일배체형 조합의 공유된 일배체형 길이에 해당합니다.
발산 시간 추정
게놈 상의 중성 영역은 코딩 서열(CDS), 반복 요소 및 보존된 비암호화 요소(CNE)의 30kb 인접 영역을 포함하는 갭 영역 및 유전자 영역을 제외한 후 선택되었습니다. 개 참조 게놈 CanFam3.1의 반복 요소 주석은 UCSC 게놈 브라우저에서 구현된 테이블 브라우저를 사용하여 얻었습니다. 21종의 태반 포유류 종에 걸친 CNE의 정보는 UCSC Table Browser를 사용하여 phastCons38wayPlacental 테이블에서 마우스 게놈 어셈블리 GRCm000001635(RefSeq accession no. GCF_2.60)의 좌표에서 얻었고, 다시 매핑되어야 하는 염기의 최소 비율을 0.5로 설정하여 UCSC LiftOver를 사용하여 개 참조 게놈의 정보로 변환되었습니다.53 또한, SNP의 수를 줄이기 위해 SNP 사이의 최소 거리를 1kb로 설정하여, 각 품종에 대해 가장 높은 서열 깊이를 가진 단일 개체를 사용하여 변이 분석에서 호출된 302,436,1개의 SNP 중 536,434개의 이중대립유전자 부위를 생성했습니다. 발산 시간은 BEAST v1.5.2에 포함된 SNP 및 계통발생학적 분석을 위한 AFLP 패키지(SNAPP) v2.6.6를 사용하여 추정되었으며, 루트 발산 시간을 35,000년 전 로그 정규 분포± 5,000 ± 15,000 및 5,000 500,000 반복으로 제한했습니다.41 입력 XML 파일은 ruby 스크립트 snapp_prep.rb를 사용하여 생성되었습니다.42 또한 번인 반복의 20%가 TreeAnnotator v2.6.6을 사용하여 제거되었습니다.43 발산 시간이 있는 추론된 트리는 FigTree v1.4.4를 사용하여 시각화되었습니다.44
PSMC 분석
기본 품질 >30 및 매핑 품질 >30의 합의 시퀀스는 bcftools v1.16 mpileup 및 호출48 다시 보정된 BAM 파일에서 가져옵니다. 최소 및 최대 깊이는 bcftools의 vcftutils.pl 사용하여 각각 10 및 100으로 제한되었습니다. 컨센서스 시퀀스는 PSMC v2.0.6-r5에 포함된 fq67psmcfa를 사용하여 PSMC FASTA 포맷으로 변환되었다.45 PSMC는 매개 변수 "-N30 -t15 -p "4 + 25∗2 + 4+6"으로 실행되었습니다.
승인을
이 논문은 2022년 건국대학교의 지원을 받았다. 우리는 Rogar Sargent가 베트남 토착 개의 저작권이 있는 사진의 사용을 허용한 것에 대해 감사드립니다.
저자 기여
개념화, BA 및 CP; 방법론, B.A.; 소프트웨어, BA; 자원, M.K., H.J. 및 J.-S.K.; 조사, BA 및 CP; 데이터 큐레이션, BA; 작문 – 원본 초안, BA 및 CP; 작문 – 검토 및 편집, BA, CP 및 JH; 시각화, BA 및 MK; 프로젝트 관리, CP 및 HJ; 감독, C.P., J.H. 및 H.J.; 자금 조달, C.P.
이익 선언
우리는 선언 할 이해 상충이 없습니다.
보충 정보이 문서에 포함된 모든 추가 파일 다운로드이게 뭐죠?
다운로드 : Acrobat PDF 파일 다운로드 (1MB)
문서 S1. 그림 S1–S11.
표 S1. STAR 방법과 관련된 이 연구에 사용된 205개 개과 동물의 전체 게놈 서열.
표 S2. STAR 방법과 관련된 이 연구에 사용된 각 개 품종 및 야생 개과 동물의 개체 수.
표 S3. 개 개체군과 뉴기니 노래하는 개 또는 중국 북부 토착 개 사이의 쌍별 FST, 그림 1과 관련된.
표 S4. 개 개체군과 뉴기니의 노래 또는 코요테 사이의 쌍별 FST, 그림 1과 관련된.
표 S5. 그림 27D와 관련된 1개의 개과 개체군에 대한 추정된 근친 교배 계수.
표 S6. 동남아시아 및 동아시아(SEA)와 티베탄 테리어 조상의 상대적 비율, 그림 3과 관련됨.
표 S7. 그림 3과 관련된 동남아시아 및 동아시아(SEA) 및 서유라시아(WE) 조상의 상대적 비율.
데이터 및 코드 가용성
참조
인용 (0)