제1기 Computational Genomics Course (
http://www.bioinformatics.pe.kr/course/CGC/ ) 의 선발 기준 시험 문제입니다. 재미로들 한번씩 풀어 보세요.
(요구 : 문제1~5 필수, 6~15중 택 5문)
<문제 1. 금년은 James Watson과 Francis Crick이 DNA 이중나선
구조를 밝힌지 50주년이 되는 해이다. DNA 이중나선 구조를 생각해낼 당시 Watson에게 이를 떠오르게 했던 것은 어떤 관찰들이었는가?>
<문제 2. 사람은 전세계에 분포하고 있음에도 불구하고 다른 종에
비해서 유전적으로 상당히 homogeneous하다고 한다. 이렇게 된 원인에 대해서 나름대로의 의견이나 혹은 공부한 것이 있으면 간략하게 적어보라.>
<문제 3. 독감은 계속해서 새로운 유행이 발생하게 되며, 독감 예방
주사는 매년 다시 맞아야 한다. 그 이유를 간략하게 적어보라.>
<문제 4. n개의 구슬이 꿰어져 있는 목걸이가 있다고 하자. 이 목걸이를 계속 절반으로 자른다고 할 때, 몇 번을 자르면 구슬 1개짜리
토막이 되겠는가?>
<문제 5. 로_또 복_권(_는 검색엔진에 쓸 데 없이 걸리지 않도록 하기 위함임)의 당_첨 확률을 높여준다고 주장하는 것들 중에서 숫자들의 합이 일정 범위에 속하도록 하라고 하는 것이 있다. 이것이 왜
엉터리인지 설명을 해보라.>
<문제 6. 쌀은 작물 중에서 가장 먼저 genome sequence가 밝혀진
것이다. 그 이유는 무엇인가?>
<문제 7. 동물의 genome sequencing에서는 시료로써 정자를 사용하는 경우가 흔하다. 그 이유를 설명하라.>
<문제 8. 우리가 먹는 멍게와 복어가 이미 genome sequence가 밝혀진 동물들의 목록에 포함되어 있다. 각각에 대해서 그 이유를 설명해 보라.>
<문제 9. sequence alignment는 유전자의 서열이 서로 닮은 것들을
찾아주는 것이다. 이렇게 서로 유사한 유전자를 찾아내는 일이 왜
쓸모가 있게 되는 것일지 간략하게 설명을 해보라.>
<문제 10. DNA computer란 분자생물학적인 여러 가지 방법을 이용하여 일종의 컴퓨터처럼 작동하도록 구현하는 것이다. 이의 한 예를 들면 다음과 같다. 어떤 나라의 주요 도시들 사이에 항공편이 있다고 하자. 이때 한번 방문한 도시를 재차 방문하지 않고 그 나라의
모든 주요 도시를 빠짐없이 방문할 수 있는가 하는 질문이 가능하게 된다. (이를 Hamiltonian path problem이라고 하며,
bioinformatics를 비롯한 다양한 실용적인 곳에서 등장하게 된다.)
각 도시에 해당하는 Watson strand의 40mer oligo를 한 세트를 만들고, 다시 Crick stand에 대해서 서로 항공편이 있는 도시인 경우 양
도시에 20mer 씩 상보적으로 걸치는 40mer oligo 한 세트를 만든다. 이 두 세트의 oligo를 섞어서 ligation을 한 다음에 그 결과물에서
길이가 "모든 도시의 연결"에 해당하는(agarose gel electrophoresis를 이용해서) 것을 고르고, 다시 그 중에서 한 도시도 빠짐없이 다
들어가 있는(affinity column을 이용해서) 것을 골라낸 다음에, 이것을 sequencing을 하면 도시들의 연결 순서를 알 수 있게 되고, 이것이 바로 찾고자 하는 Hamiltonian path가 된다. 물론 이때 PCR을 이용하여 중간중간 양을 증폭을 시켜주어야만 할 터인데, 이를 위해서는 첫출발을 하는 도시와 마지막 도착하는 도시는 주어져 있을
필요가 생기게 된다. (Reference: Science 1994 Nov
11;266(5187):1021-4) 이 방식의 DNA computer는 실용적인 규모의 일에 쓸 수 있는 것이 되기에는 결정적인 단점을 가지게 되는데,
그것이 무엇일지 한번 생각을 해보라.>
<문제 11. "암세포에서 같은 조직의 정상세포에 비해 더 많이 발현되는 유전자가 발암유전자"라는 식의 생각은, "화재가 난 건물에서
화재가 나지 않은 건물에 비해서 더 많이 발견되는 사람"과 유사한
논리의 전개이다. 즉, "소방관이 화재의 원인" 식으로 되는 것이다.
이처럼 복잡한 현상을 단순한 시각으로 보게 되면 자칫 장님 코끼리 만지기가 되어 버리게 된다. 앞의 소방관의 예와 유사한 예를 더
생각을 해보라.>
<문제 12. "association is not causality"라는 문구는 (물론 같은 생명현상이므로 본질적으로는 모두에게 해당되는 것이지만) 특히 소위
omics 연구자로서 항상 유념하고 있어야 할 중요한 점인데, 이는 생명현상이 많은 수의 요소들의 상호작용이고 omics가 이 요소들 최대한 전부를 관찰하고자 하는 방식이라는 점에서 더욱 그러하다.
또한, 요소의 수가 많을수록 겉보기에는 의미가 있어 보이나 단순히 우연에 의한 패턴이 더욱 흔하게 나타나게 되는데, 이 점 또한
omics 연구자로서 항상 주의를 해야 하는 점이다. 이와 관련된 일상생활의 예로는, 밤하늘에 별자리가 존재하는 것부터 시작을 해서
9.11 사태시의 뉴욕 무역센터 빌딩의 연기와 화성 표면의 사람 얼굴에 이르기까지 다양한 형태로 찾아볼 수가 있다. 이러한 "우연에 의한 패턴"의 예를 더 생각을 해보라.>
<문제 13. 같은 종의 임의의 두 개체 사이에는 다양한 형태의 유전정보의 차이가 존재한다. 이 중에서 소위 단일염기다형성, 즉
SNP(Single Nucleotide Polymorphism)이라 불리는 것은 이름이 뜻하는 바와 같이 동일한 위치에서 단일염기가 서로 다른 것을 일컫는다. 이와 같은 단일염기변이는 DNA 복제 과정에서 어느 정도 비율로 변이가 발생을 하므로, 계속 새롭게 생겨나게 될 것이다. 예를
들면, 서로 다른 정자와 난자의 융합 결과인 형제 혹은 자매들 사이에도 그 과정에서 일어난 변이에 의해 서로 다른 (당연히 부모와도
다른) 단일염기변이들이 존재하게 될 것이다. 그런데, SNP의 정의에는 위에 덧붙여서, 어느 한 집단에서 다수의 개체를 조사를 하였을 때 적어도 어느 정도 이상의 비율(일반적으로 1%)로 공통적으로
차이를 보이는 위치일 것이 요구된다. SNP의 주된 용도는 유전적
차이와 특히 고혈압이나 당뇨병과 같은 소위 common disease 및
기타 형질과의 연관을 지어볼 때 표지로써 사용을 하고자 하는 것이다. 이를 위해서는 왜 일정 비율 이상에서 공통적으로 변이를 보이는 위치일 것이 요구되는지에 대해서 한번 생각을 해보라.>
<문제 14. 이른바 파스칼의 삼각형이라 불리는 것은 좌우대칭이다.
왜 좌우대칭이 되어야 하는지를 말로 풀어서 설명을 해보라. 물론
단순히 숫자 배열이 그러하므로 그렇다는 무용한 설명이 아니라,
파스칼의 삼각형이 무엇을 위한 것인가 하는 점에서 출발하여 생각을 해보라.>
<문제 15. GPS(Global Positioning System)의 원리에 대해서 최대한 간단명료하게 적어보라.>
첫댓글 5, 7, 8, 12, 14, 15 설명 부탁 ... (문제11의 경우는 Not always! ㅡㅡ^)
저..저거 링크 된 곳 따라서 들어가보니 기가 질리네요 ㅋ