“인간 A와 인간 B가 유전자의 xx.xx% 공유한다”는 말의 의미는
무엇인가? 여러 가지를 뜻할 수 있을 것이다. 그리고 여기에는
온갖 복잡한 사정들이 얽혀 있다. 의미를 따지기 전에 먼저 복잡한 사정들에 대해 살펴보자.
첫째, 핵에도 DNA가
있지만 미토콘드리아에도 DNA가 있다. 핵에 있는 DNA만 비교할 것인지 아니면 세포 내에 있는 전체 DNA를 비교할
것인지를 먼저 정해야 한다.
둘째, 한 인간의 모든 체세포의 DNA가
완전히 똑 같은 것은 아니다. 만약 그렇다면 암이라는 병은 존재하지도 않을 것이다. 체세포 분열 과정에서 돌연변이가 일어나기도 한다. 따라서 비교 결과가
근사치일 뿐이라는 것을 명심해야 한다.
셋째, 남자와 여자의 성염색체가 다르다. 성별이 같은 두 사람을 비교하는 것과 성별이 다른 두 사람을 비교하는 것을 따로 취급해야 한다.
넷째, 사람마다 염기 서열의 길이가 조금 다를 수 있다.
비교 방식에는 여러 가지가 있을 수 있다.
첫째, 전체 염기 서열 중 일치하는 것들의 비율을 따질 수 있다.
둘째, 단백질 합성에 개입하는 염기 서열 중 일치하는 것들의 비율을
따질 수 있다.
셋째, 전체 유전자들 중 일치하는 것들의 비율을 따질 수 있다.
여기에서 regulatory sequence나 intron과 같은 것들을 “단백질 합성에 개입하는 염기 서열” 또는 “유전자”에 포함시킬 것인가 말 것인가를 먼저 이야기해야 한다. 여기에서는 거기까지 따지지는 않을 것이다.
얼핏 보면 둘째와 셋째가 같아 보이지만 엄연히 다르다. 논의의 편의상
인간의 유전자가 23,000개라고 하자(실제 추정치). 그리고 모든 유전자가 1000개의 염기 서열로 이루어져 있다고
하자(내가 임의로 제시한 수치). 인간 체세포의 DNA는 하나의 쌍으로 이루어져 있지만(diploid) 논의의 편의상
하나로만 이루어져 있다고 하자(haploid).
두 사람의 23,000개의 유전자들 중에 99%인 22,770개가 완전히 똑 같다고 하자. 그리고 서로 다른 230개의 경우 모두 1000개의 염기 서열 중 10개씩만 다르다고 하자(매우 인위적인 가정이다). 그러면 전체 유전자중 서로 다른 염기 서열의
개수는 230 * 10 = 2,300개다.
이런 경우 셋째 방식으로 따지면 “99%가 같다”는
결과가 나온다. 왜냐하면 23,000개의 유전자들 중에 99%인 22,770개가 완전히 똑 같기 때문이다.
만약 둘째 방식으로 따지면 어떨까? 단백질 합성에 개입하는 염기 서열의
길이는 23,000 * 1000 = 23,000,000개다. 이
중에 서로 일치하지 않는 염기 서열의 길이는 2,300개다. 따라서
단백질 합성에 개입하는 염기 서열 중 일치하는 것들의 총 길이는 23,000,000 - 2,300 = 22,997,700개다. 그렇다면 단백질 합성에 개입하는 염기 서열 중 일치하는 것들의 비율은
22,997,700 / 23,000,000 * 100 = 99.99%다.
지금까지는 한 종의 두 개체를 비교할 때에 대해 이야기했다. 전공자가
아닌 사람이 보기에는 충분히 헷갈리고 복잡하다. 하지만 서로 다른 두 종을 비교할 때에는 더 복잡해진다.
첫째, 서로 종이 다르면 염기 서열의 총 개수나 유전자의 개수가 다르다. 만약 비교할 것들의 개수가 서로 다르다면 비교 자체가 어떤 의미에서는 무의미하다.
둘째, 염기 서열의 총 개수가 다르다면 같은 역할을 하는 유전자라고
여겨지는 유전자가 유전체에서 차지하는 위치가 종마다 다를 수 있다. 온전한 비교가 되기 위해서는 이
다른 위치까지 고려해야 한다.
셋째, 서로 다른 두 종의 두 개체를 비교하는 방식이 있다. 예컨대 침팬지 개체 A와 인간 개체 B를 비교하는 방식이다. 하지만 이것은 각 종에 속하는 개체를 비교한
것일 뿐이다. 이 수치를 보고 두 종을 비교한 수치라고 말할 수 있을지 의문이다.
이 글에서 살펴본 것 말고도 상황을 복잡하게 하는 요인들이 더 있을 것이다. 그럼에도
불구하고 내가 본 여러 편의 글에서는 이런 것들에 대해 자세히 다루지 않고 있다. 그냥 “인간과
침팬지는 유전자의 98.5%를 공유한다”는 식으로 수치만 제시되어 있다.
대중이 유전율(heritability)을 오해하는 경우가 많다. 유전율 개념을 정확히 이해하지 않고 “IQ의
유전율은 70%이다”라는 문구를 직관적으로 또는 상식적으로 해석하면 이상한 결론으로 이어질 수 있는 것이다. 어쨌든 유전율은 잘 정의된 개념이며 http://en.wikipedia.org/wiki/Heritability
와 같은 글을 보면 된다.
서로 다른 종이 유전자를 공유하는 정도를 비교하는 여러 방식에 대해 자세히 설명한 글이 있을 것 같은데 나는
아직 찾지 못했다.
2010-08-02
첫댓글 좋은 질문입니다. 관심없는 분들도 계실지 모르겠지만...
일반적으로는 같은 protein을 coding하는 gene을 정해서, 그 gene 안의 염기서열을 모두 비교하는 걸로 알고 있습니다. 즉, intron 과 regulatory sequence는 빼고 합니다.
하지만 gene 중에 critical 한 부분(amino acid가 바뀌게 되는 nucleotide의 변화)만 비교하면 99.4%가 일치한다는 보고도 있지요.
또 다른 보고 에서는 95%가 일치한다고 하는데, 이 경우는 non-functioning sequence 까지 모두 비교한 걸로 기억합니다.