2025년은 '단백질의 해'라고 불러도 될 것 같다. 단백질은 시리얼, 우유 팩, 심지어 파스타에까지 첨가되고 있다. 모두가 더 많은 단백질을 원한다. 단백질은 인체의 기본 구성 요소다. 세포의 대부분을 구성하고 생명을 가능하게 해준다.
단백질은 DNA 구간에 암호화되어 있다. 지난 수십 년간 우리는 인간 게놈과 많은 다른 종의 게놈을 샅샅이 조사했고, 1만 9,500여개에 달하는 단백질 암호화 유전자를 모두 알아냈다고 생각했다. 그런데 단백질을 만들어서는 안 되는 DNA 구간에서 단백질처럼 보이는 것들이 나오는 현상을 최근 발견했다. 줄곧 거기 있었지만 우리 눈에 띄지 않았다. 분자생물학계에서 지금 가장 뜨거운 ‘다크 단백질’dark protein이다. 그리고 이들을 유용하게 활용하기 위한 임상시험이 현재 진행 중에 있다.
다크 프로테옴
단백질은 아미노산이 사슬처럼 연결된 ‘긴’ 구조이다. 그런데 2000년대 들어 비정상적으로 짧은 단백질 몇 가지가 발견됐다. 그 중 초파리에서 발견된 아주 작은 한 단백질은, 손상되면 파리의 해부학적 구조에 심각한 결함이 나타났다. 이렇게 작은 단백질이 이토록 큰 생물학적 영향을 미칠 수 있다는 사실이 다크 단백질을 탐구하게 된 첫 번째 계기였다.
두 번째는 이런 작은 단백질이 어디서 만들어지는가였다. 2009년, N. 인골리아가 리보솜에서 나오는 모든 산물을 포착하는 데 성공했다. 리보솜은 유전자에서 전사된 mRNA를 읽고 단백질로 번역한다. 코로나19 백신 중 상당수에 쓰인 그 mRNA 바로 그 전사체이고, 리보솜이 그것을 단백질로 번역한다.
인골리아 연구팀이 리보솜에서 나오는 산물들을 들여다보다가, 짧은 단백질처럼 보이지만 이전에 한 번도 본 적 없는 분자들을 발견했는데 바로 ‘다크 단백질’이었다. '다크'하다는 것은 사악하거나 질병을 일으키기 때문이 아니라, 존재하지만 보이지 않는 ‘암흑물질’에 비유한 것이다. 인체에 있는 모든 다크 단백질을 통틀어 '다크 프로테옴'dark proteome이라고 한다. "다크 단백질 연구를 소수만 하고 있고 광범위한 지지를 받지 못한다고 생각할 수 있는데, 전혀 그렇지 않고 정말 중요한 연구"라고 미국 미시건대학교 소아 혈액종양학 의사이자 다크 단백질 분야의 선도 연구자 중 한 사람인 J. 프렌스너 박사는 말한다.
다크 단백질을 연구하는 전 세계 약 25개 학술 기관의 TransCODE 컨소시엄은 최근 네이처에 논문을 발표하여 다크 단백질 연구의 방법론을 제시하고, ‘펩타이데인’peptidein이라는 공식 학명도 부여했다. 펩타이드peptide와 단백질protein을 합친 조합어다. 펩타이데인은 처음 발견되었을 때 역할이 불분명하기에 펩타이데인이라 불렀다. 일반 단백질처럼 행동한다는 것이 증명되면 정식 단백질, 혹은 짧은 길이를 감안해 ‘마이크로프로테인’microprotein으로 재분류한다. 아미노산이 100개 미만이면 마이크로프로테인이라 부른다.
펩타이데인이 오랫동안 눈에 띄지 않았던 이유는 무엇일까? 한마디로 규칙 때문이다. DNA의 어느 구간이 단백질을 암호화하는지에 대한 규칙, 즉 ‘여기서 시작’이라는 특정 염기 서열이 있다고 생각했다. 그런데 알고 보니 그 서열이 없어도 단백질이 만들어질 수 있었다. 그런데 다크 단백질을 만드는 지시는 단백질을 암호화해서는 안 되는 DNA 부분에 있었다.
인간 게놈 프로젝트 당시 언론에서 자주 썼던 표현으로 '정크 DNA'라는 말이 있는데, DNA에서 단백질을 암호화하는 유전자 외 나머지 상당 부분에 한때 '쓰레기 DNA'라는 딱지가 붙었다. 그런데 이 정크 DNA 일부가 다크 단백질을 암호화한다는 사실이 밝혀졌다. 또 다른 다크 단백질들은 실제 유전자 바로 근처, 그 유전자의 발현을 조절하는 구간에 암호화되어 있다.
다크 단백질은 실존하며 이것들은 과연 무슨 일을 할까? 인간에게서 100여 개가 제대로 밝혀져 있고 수천 개가 탐구 중이다.
근본적으로 다른 생물학
퀘벡 셔브루크대학교 소아과 유전자 서비스에서 다크 단백질을 연구하는 M. 브뤼네 박사는 "지금 '무엇이 존재하는가'에서 '그것이 무엇을 하는가'로 넘어가고 있다."고 말했다. 일부 펩타이데인은 크기가 작고 암호화 방식이 독특해서 놓쳤을 뿐, 이미 충분한 증거가 쌓여 진정한 짧은 단백질로 인정되고 있다.
그러나 많은 펩타이데인들은 구조만 단백질과 비슷할 뿐, 리보솜을 막는 역할만 할 수도 있다. 세포 입장에서는 이것이 유리할 수도 있다. 세포가 모든 단백질을 항상 만드는 것은 아니며, 단백질 생산은 수십 가지 방식으로 정밀하게 조절되는데, 펩타이데인이 리보솜을 일시적으로 막는 또 하나의 조절 수단이 될 수 있다. 이 경우 펩타이데인 자체는 의미가 없고, 그것을 암호화하는 DNA가 중요하다.
프렌스너 박사는 소수의 펩타이데인만 전통적 단백질로 밝혀지고, 다수는 "근본적으로 다른 생물학"을 가진다고 한다. 브뤼네 박사는 각 펩타이데인마다 존재 이유가 다를 수 있다고 했다. 하나는 전통적 단백질로 판명되고, 다른 것은 제어가 무너진 암세포에서 나온 일시적 산물이고, 또 다른 것은 리보솜이 번역한 뒤 즉시 분해되는 정상 생물학의 부산물일 수 있다는 것이다.
다크 단백질의 응용
다크 단백질 관련 연구자들은 질병 치료의 새로운 방법을 개발하는 바이오테크 기업들과 어떤 식으로든 연결되어 있으며, 산업계와 학계 모두 다크 프로테옴 지식을 빠르게 임상에 적용하려 한다. 두 가지 응용 분야가 논의되고 있다.
첫째, 진단. 특정 암에만 나타나는 다크 단백질이 있다면, 이를 검출하는 것이 그 암의 진단 방법이 될 수 있다.
둘째, 치료. 역할도 잘 모르는데 치료에 쓴다고 우려할 수도 있지만 다크 단백질이 암세포 표면에는 있고 정상 세포에는 없다면, 그것을 표적으로 하는 면역 치료를 설계할 수 있다. 면역 세포가 그 표지를 적으로 인식하고 그것을 달고 있는 세포를 공격하도록 훈련시키는 것이다. 이미 기존 단백질로 이런 치료를 하고 있다. 다크 단백질의 발견은 표적 후보를 더 넓혀줄 수 있으며, 적어도 하나의 임상시험이 이미 이 가설을 검증하고 있다.
다크 단백질은 유망하지만, 상당한 도전 과제들이 앞에 놓여 있다. 크기가 작아 질량분석법으로 탐지하기 어렵고, 대다수는 합성 직후 세포 내에서 빠르게 분해된다. 지금까지 두 개 이상의 연구에서 재현된 것이 거의 없어서, 진단 및 치료 가능성이 기대되었던 마이크로RNA 분야에서도 목격한 '재현성 부족' 문제가 반복될 수 있다. 또 다크 단백질에 추적 태그를 붙이면 단백질이 너무 작아서 태그 자체가 위치를 바꿔놓아 잘못된 정보를 줄 수 있다.
또 다른 장애물도 있다. 다크 단백질에 관한 엄밀한 논문 상당수는 미국 국립보건원(NIH)의 자금 지원을 받은 연구들인데, 현재 NIH의 지원이 대폭 축소되고 있다.
기초 연구 발견이 얼마나 사소해 보일 수 있는지를 잘 보여주는 또 하나의 사례가 다크 단백질이다. 단백질을 만들어서는 안 되는 DNA 구간 연구와 리보솜에서 나오는 모든 것을 추적하는 데 왜ㆍ 돈을 써야 하는가? 실용 가치 없는 지식 수집처럼 보일 수 있겠지만, 지식 수집은 그 자체로 가치가 있고, 그 중 어느 부분이 가까운 미래에 암 치료를 뒤바꿀지 아무도 모른다.
눈앞에서 일어나는 진화
다크 단백질에는 뭔가 기묘한 점이 있다. 단백질처럼 보이지만 매우 짧고, 많은 것들이 무언가를 할 기회도 없이 분해되며, 단백질을 만들어서는 안 되는 게놈 부위에서 나온다. 세포가 내부에 만들어 놓은 이상한 실험실 같다.
"실시간으로 진화를 목격하고 있는 것은 아닐까?"라고 브뤼네 박사는 말한다. 이것은 드 노보 유전자 탄생de novo gene birth, 즉 유전자가 무에서 생겨날 수 있다는 이론적인 개념과 연결된다. 다크 단백질들 중 일부는 새로운 유전자가 탄생하는 방식 중 하나일 수 있다. 많은 인간 다크 단백질이 다른 종에서는 발견되지 않는다는 점에서 특히 그렇다. "이 펩타이데인 중 일부는 아직 완성되지 않은 단백질의 복사본일 수 있다. 아직 진화하는 중일 수 있으며, 미래의 표준 단백질이 될 수도 있다."고 브뤼네 박사는 말한다. 이것들이 존재한다는 것을 알게 된 이상 계속 주목해야 할 이유는 충분하다.
요약
· 다크 단백질(펩타이데인)은 단백질을 만들 것으로 여겨지지 않았던 DNA 구간에서 만들어지는 짧은 단백질 유사 분자다.
· 역할은 아직 연구 중이다. 일부는 진정한 단백질로 밝혀지고, 일부는 아무 역할이 없거나 아직 알려지지 않은 역할을 할 수 있다.
· 일부 다크 단백질은 특정 질병의 진단 또는 면역 치료 표적으로 활용될 가능성이 있다.