CRO (contract research organization)은 stat/biostat으로 석사를 받은 사람에게는 아주 좋은 직업이다.
회사마다 다르지만 Quintiles의 직급은 다음과 같다.
Biostatistician 1
Biostatistician 2
Senior Biostatistician
Principal Biostatistician
Biostatistician 1은 석사학위 초짜에 해당되는 자리다. 보통 2년이면 biostatistician 2로 승진한다.
그런데 PhD를 받은 초짜는 biostatistician 2로 들어온다.
PhD 받는데 2년은 훨씬 더 걸릴텐데, 석사받고 2년이면 동일해진다. 그렇다고 PhD가 뭐 유리한것도 아니다. 왜냐하면 CRO statistician에게 통계지식은 별로 중요하지않기때문이다.
반면 제약회사는 PhD만 뽑는다.
보통 biostatistician하면 project lead statistician이다. 즉 project에서 TLF(tables, listings, figures)를 만드는 team이 시간내에 budget내에서 실수없이 TLF를 만들도록 관리한다.
제약회사 statistician은 CRO statistician을 관리한다.
이런 일을 몇 년 하다보면 대학원때 배운 고급 통계방법은 다 까먹는다.
그렇다고 lead statistician이 바보가 된다는 건 아니다. lead statistician은 데이터 생성부터 TLF를 만드는 모든 과정을 정확히 다 알고 있어야한다. 알고 시키는 것이다. Team에 있는 statistician, sas programmer들이 질문하면 답변하는건 lead statistician이다. 경험 많은 Lead statistician은 임상시험 결과를 입력하는 아래 링크의 CRF만 보면 어떻게 TLF를 만들지 머리로 생각해 낼 수 있는 경지가 된다.
http://www.accessdata.fda.gov/Static/widgets/tobacco/MRTP/09%20appendix-2h-smna-smkng-cstn/sm-08-01/1.%20CSR/16.1.2-sample-case-report-form.pdf
즉 복잡한 통계는 까먹어도 저런류의 통계에는 도사가 된다.
CRO건 제약회사건 회사 전반에서 발생하는 어려운 통계일을 해결하는 즉 consulting을 주로 하는 소수의 그룹이 있다. Principal biostatistician이 하기도 하지만 Statistical scientist라는 직함을 갖는다. 이 사람들은 frequentist 방법론은 물론 Bayesian 방법도 잘 알고 있어야한다.
즉 PhD를 받은 사람중 통계방법론에 관심 있으면 이 과정을 밟으면 된다.
사실 PPD에서 나를 뽑을때 이 과정으로 키우려고 뽑은 것이다.
내가 초반에 겪은 일을 얘기해보자면… 약간 아슬아슬했었다...
내가 SAS에 입사하기 전 CRO에서 직책은 Senior Biostatistician 4년차로, 곧 Principal이 될 몸이었다.
그런데 SAS에 있던 6년동안 임상시험 데이터가 CDISC로 표준화되면서 변한 것도 많았고 그나마 경험도 다 까먹었다. 그래서 도로 Senior biostatistician으로 돌아왔다.
PPD는 다른 회사와는 달리 Senior biostatistician 1, 2가 있다. 1로 들어왔으니 사실상 강등이다.
그런데 문제는 내가 Senior biostatistician의 주업무인 project lead의 일을 감당할 수 없다는 것이다. 그래서 모르는 일 하냐고 스트레스를 엄청 받고 있었다.
입사 초반에 전체 메일로 누가 질문을 했다. 읽어보니 Y를 log-변환해서 linear mixed models에 적합했는데 client가 CV(coefficient of variation)를 요구한다는 것이다. 그래서 인터넷 검색해보니 sqrt{exp(분산)-1}인데 이게 맞는지 확인해 달라는 것이다.
그건 log-normal 분포의 CV이다. 어떤 확률변수 Y가 log-변환해서 정규분포를 따르면 log-normal 분포를 따르는 것이다. 아래와 같이 정규분포의 mgf를 이용해 기대값, 분산, CV를 구하는데 답이 너무 깔끔해서 수리통계학 숙제/시험에 가끔 나온다.
아래 마지막 두 식에 괄호 안에 +가 아니라 -다. 오타인데 LaTeX여서 고치기가 귀찮다^^
답장을 하면서 manager에게 자랑하려고 forward를 했다.
그런데 이상하게도 질문한 넘은 고맙다는 답장도 없었다.
manager는 어떻게 그런걸 아냐며 신기해하더니 물어본 사람이 principal biostatistician이고 회사에서 통계를 가장 많이 아는 사람중 하나란다. 아마 그 친구 너무 기본적인걸 몰랐다는 생각에 자존심이 상했던것 같다. 그런데 저걸 누가 기억하냐. 나는 Pharmacokinetics(임상약리학)를 하면서 자주 봐서 기억할 뿐이다. 하여간 그때 메니저에게 통계는 많이 안다는 인상을 줬다.
그후 한참을 하지도 못하는 project lead로 버벅대고 있으니, 내 프로젝트를 위에서 감시하는 Angela가 내 매니저에게 나에 대한 불만을 얘기했다.
그런데 운이 좋게도 그날 마침 그 프로젝트에서 난데없이 등장한 2*3 incomplete cross-over design의 sample size 문제를 해결했다. 이건 CRO에서는 아무나 할 수 있는 일이 아니었다. Angela가 그 얘기를 하면서 통계는 확실히 잘 아는 것 같다고 했단다. 그래서 나는 project lead는 biostatistician 1 레벨이고, 통계지식은 principal 레벨로 여겨지게 되었고, 일단 project lead 하는데 경험이 쌓여 돌아가는 과정에 익숙해지면 statistical scientist로 키우려는 계획이라고 들었다.
그런데 이놈의 project lead는 내 체질이 아닌것같다. 그리고 여기에 익숙해질 시간이 되면 나도 통계를 다 까먹고 다른 statistician처럼 될 것 같다. 아무래도 다른 회사 statistical scientist로 도망가야할 것 같다.
첫댓글 멋지십니다 ^^
쓸데없는 질문인데 incomplete crossover design의 sample size는 어떻게 계산하나요?
incomplete는 생각하지말고, 2*2 crossover design을 생각하시고, A, B 두 약을 두 period에 먹으니 paired t-test 문제이죠. 사람 절반은 약먹는 순서만 뒤집은거니 그냥 paired t-test로 구하면 됩니다.
@안재형 감사합니다.^^
글을 정말 잘 쓰시네요. 유익한 정보 감사드립니다. 3탄도 기대합니다..
ㅋㅋ 재밌게 읽어주셔서 감사합니다^^
이쪽 일이 참 재밌는 것 같습니다. 선생님 글을 보면, 지금 일보다는 이 일이 제 적성에 더 맞을 것 같다는 생각이 드네요.
이분야에서 medical 전문가가 통계를 하면 천하무적이죠^^
아주 잘쓰셨습니다. 그런데 한가지 말씀드리고 싶은것은 CRO와 제약회사의 point of view가 많이 다릅니다. 직급의 레벨도 다르고 일하는 방향도 다릅니다. 또 회사의 크기와 어떤 분야의 회사인가가 많이 달라집니다. 제가 시간을 내서 제약회사의 입장에서 추가 설명을 곧 드리겠습니다. 제 생각에는 안재형님은 제약회사에서 일하시는것이 더 좋을것 같습니다.
흑흑, 이동네는 제약회사가 거의 없습니다. 그나마 있던 GSK가 닫았습니다. UCB라고 공고가 떴는데 뭔지 처음 듣는 회산데 지원해보려고요...
@안재형 여기 북가주는 회사가 아주 많지만 집값이 비싸요. 샌디에고는 제약회사가 아주 많지는 않지만 그나마 여기보다는 훨씬싸고 살기 좋을겁니다. Benefit을 생각하시면 LA 북쪽에 있는 Amgen 좋고요. Amgen 관심있으시면 다리놔 드릴수있읍니다.
@SASMaster 감사합니다. 그런데 저는 이동네(RTP)가 좋아서 여기서 애들 학교 보내고 계속 살 생각입니다. 여긴 CRO 투성이입니다. 제약회사는 매우 작은 회사만 있는 듯합니다.