요사이 시간이 나서 뒤늦게 str로 snp 추정해 보았는데
str loci는 17-str모두 돌리기에는 snp 해상도가 의미없기에
DYS19,DYS389I,DYS389II,DYS390,DYS391,DYS392,DYS393,DYS385,DYS437,DYS438,DYs439 요 11개 좌위를 가지고 추정을 해보았다.
현재 본인의 snp-str db는 이 카페에서 제공된 것을 가지고 구축하였는데 이 snp-str db가 얼마나 방대하느냐에 따라 11개 좌위 추정은 첫 돌리기에서 많은 추정례가 나올 것이다. 그러나 요 11개 좌위 추정에서도 여전히 최상위 하플로 (A,...Z)이 가려지지 않는 경우가 있다.
이 상태에서 추정이 된 것 중에서 최상위 하플로가 다르면 나머지 6개 좌위를 추가해서 구분한다.
다음은 추정이 안 된 샘플을 가지고 11개 좌위중 1개만 다르고 다른 1개 좌위는 특정 snp의 좌위값에 해당하는지를 따진다.
즉 이런 로직을 11번 돌린다.
이런 과정을 통하면 추정의 신뢰도는 떨어지게 된다. 대체로 통계학에서 신뢰도가 95%이므로 최종 신뢰도는 (0.95**11=0.568800092)에 지나지 않는다.
그러나 이런 과정을 통해서도 여전이 추정불가예가 나온다. 이런 예는 '모른다'로 따로 빼야 할 것이다.
그런데 `모른다`라고 하지 않으면 신뢰도는 더 떨어질 수 밖에 없다.
물론 자기 나름의 heuristic을 적용해서 추정예를 높일 수 있겠지만 그 heuristic에도 오류판정의 가능성이 있는데 그 오류의 정도가 얼마나 되는지 알 수 없기에 신뢰도는 50%이하로 떨어질 수 밖에 없다.
이 로직을 개선하면
추정 좌위수가 작아지면 신뢰는 높아진다. 예를 들어 2개면 신뢰도가 0.95**2=0.9025 정도 된다.
그러나 이는 의미가 없다. 여전히 겹겹snp로 잡힐 것이기에
따라서 첫 추정 좌위를 6개로 설정하면(어떤 좌위를 선택하느냐에 따라 달라진다) 0.95**6= 0.735091891
여하튼 이런 로직도
1. snp-str db가 얼마나 방대하냐?
2. 과연 특정좌위의 값의 범위로 추정하는데 있어서 신뢰도가 얼마로 설정해야 하는가?
3. 6개 좌위에 좌위를 한개씩 추가해서 추정을 해도 연전히 'snp 추정이 애매하다'가 나올 것이고.
이에 따라 신뢰도는 달라질 것이나 그 추정 신뢰도는 여전히 50% 언저리임을 인정해야 할 것이다.
반반이면 믿거나 말거나 그래도 괜찮지만 50%이하가 되면 말아야 될 것이고..
방법은 11개 좌위 돌리기에서 나온 snpbystr 결과들만 추정하고, 나오지 않은 예들은 모른다로 솔직하게 밝혀야 할 것이다.
결국 방법은 방대한 snp-str db를 구축해야 하는 것이다. 현재의 snp-str 데이타로는 그 신뢰도가 50%를 넘기 힘들다.
물론 좌위값이 하나 다르지만 특정 snp내에 str 좌위값에 대한 추정 신뢰도가 99%라면 얘기는 달라진다.
0.999*11=0.989054835
0.99**11=0.89533825
0.98**11=0.800731351
0.97**11=0.715301403
0.96**11=0.638239331
0.95**11=0.568800092
0.94**11=0.506298207
0.93**11=0.450103546
첫댓글 오랜만입니다. baaclia님.^^ 항상 Homoplasy라는 문제가 도사리고 있어서 거의 동일한 Y-STR 값이라도 상당히 촌수가 먼 경우가 종종 보입니다(특히 47z계열). 반대로 3-4정도의 Y-STR 유전적 거리를 보이고도 SNP은 현재 Geno 2.0 정도에서의 한계로는 분석해 낼 수 없는 경우가 있는 것 같습니다.
반갑습니다. 기생충님. 위에 적은 썰래발은 좀 과장된 것이고 11개 좌위를 가지고 해 보니 잡히는 게 없어서 보다 현실적인 방법으로 7개 좌위를 가지고 추정해 보니 신뢰도는 85% 언저리에 있지 않나 싶습니다. 100개 중 한 15개 정도는 물론 이는 방대한 db의 정도, 특정좌위에에 대한 heuristic의 정확도에 따라 뭐 사람에 따라 실제 결과물의 정확도는 달라지는 것이고 그저 평균적으로 그렇다는 것입니다. 정확하게 말하면 저의 추정 로직은 잘해야 85%라는 것으로 이해하시면....
좋은 정보 감사합니다