|
시작한김에 이번주에 ADLB까지 설명하도록 하겠습니다. 좀 길수가 있으니 양해바랍니다.
우선 임상시험에서 Lab data 하면 피검사와 소변검사가 있는데 소변검사는 그저 참조정도로 하고 피검사가 중요합니다. 그런데 나이가 좀 드신분들은 annual health check-up을 받으실텐데 그때마다 피검사도 합니다. 임상시험 lab data 에 대해서 잘 아시면 본인의 result를 보시고 건강상태가 어떤지 의사한테 의지하지않아도 알수있습니다. 저도 의사가 설명하기전에 미리 몇년전것을 비교해보고는 하죠. 그런데 보통 임상시험에서는 여러종류의 피검사가 필요해서 피뽑는 tube들을 아마 몇개씩을 쓸겁니다. 암환자같은경우에는 최소한 한달에 한번은 lab data가 필요한데 아픈환자한테서 많은 양의 피를 자주 뽑는다는것을 생각하니 마음이 아프더군요...
본론으로 돌아가서, Lab data를 다룰려면 Medical Terminology 를 잘알면 참 좋습니다. 혹시 선택과목을 택할수있는 여유가 있으면 간호학과나 비슷한 학과에 있는 Medical Terminology class를 듣는것을 적극 추천합니다. 제일 초보정도만 알아도 됩니다. 아마 resume에 이과목을 들었다고 쓰면 도움이 많이 될수있다고 생각합니다. 거의 모든 의약용어는 라틴이나 Greek말인데 의사들 정도까지야 알수없겠지만 그 기본을 조금이라도 이해를 하면 정말 도움이 됩니다. 예를 들어서 Oncology 라고 했을때는 간단하게 말해서 onco는 tumor를 의미하고 logy는 study of 가 됩니다. 그러니까 oncology라고 하면 암치료제 연구라고 할까요? Hematology 라고 하면 Hemato는 피를 의미하니까 피의 관한 연구 라고 할수있고요. thrombocytopenia 라고 하면 길기도하고 낯선단어이지만 thrombocytes 이라하면 platelet (혈소판) 을 말하는것이고 -penia는 "lack, deficiency" 이니까 결국 혈소판 감소증이라고 할까요? 또 자주 쓰는 말이 Hyper 하고 Hypo 인데 Hyper는 너무 많은것이고 Hypo는 너무 적은것입니다. 그러니까 Hypertension하면 고혈압이 될수있고 Hypotension하면 저혈압이 됩니다. 그러면 hypokalemia는 뭘까요? 한번 추측해보세요. 어쨋던 될수있으면 한글로 번역을 하면서 쓰지말고 뜻을 배우고 그 자체로 쓰는 연습을 해두는것이 좋습니다. 이런것들을 기본적으로 알아두면, 실지로 모르는 단어도 추측하기도 쉽고 외우기도 쉽습니다.
그래서 Oncology 나 Hematology 임상시험 경험이 있는 사람들을 뽑는 이유가 이런것들을 단순간에 배우고 터득하기가 쉽지 않아서 그렇죠. 그래서 어떻게 보면 통계학 석사보다는 간호학이나 생물/화학 전공자가 간단한 통계지식이 있으면 SP로 성공하기가 더 쉬울수도 있다고 생각합니다. Protocol을 읽거나 실지로 데이타를 다루다보면 통계지식보다는 이런 medical terminology, adverse event나 disease에 관해서 많이 아는것이 휠씬 도움이 된다고 생각합니다. 저도 하도 답답해서 오래전에 제약회사로 처음 이직한후에 일을 하면서 한학기동안 Medical Terminology class를 local city college에서 수강했습니다. GPA에 문제가 될수있으니 option이 있으면 Pass/No pass 로 등록을 하면 좋겠죠. 어짜피 A 받기도 힘들고 받을 필요가 없으니까요.
어쨋던 ADLB를 만들려면 몇가지 아주 중요한것들이 있습니다.
1. Normal Range - 수많은 Lab test종류들이 많고 데이타 자료만으로는 얼마나 심각한지를 잘 알수가 없어서 LLN 과 ULN 을 이용해서 환자의 결과가 Normal인지 아닌지를 알아봅니다. LLN 은 Low Limit of Normal 이고 ULN은 Upper Limit of Normal입니다. 그래서 ADLB에는 각 test마다 LLN과 ULN 변수들이 있어야 합니다.
2. Grade - Normal 이냐 아니냐 정도가 아니라 심각한 수준까지 가는것을 측정하기 위해서 Grade range를 이용해서 Grade를 만들어놓는데 주로 Grade 3 이상은 눈여겨 봐야 합니다. Summary table은 각 grade 별로 만들기도 하고요. 그런데 아무나 하고싶은데로 Grade를 정해놓으면 의미가 없겠죠. 그래서 CTCAE 라는 척도를 이용해서 Grade를 만듭니다. 하도 많아서 주로 꼭 필요한 Test만 Grade를 만들기도 하지요. 궁금하시면 online에서 찾아보셔도 되는데 여기 최신버전이 있네요. https://ctep.cancer.gov/protocoldevelopment/electronic_applications/docs/CTCAE_v5_Quick_Reference_5x7.pdf 미리 언급했지만 사실 통계학 공부하고는 아~무런 관계가 없는것들이지만 SP나 Biostat으로 암치료에일을 하실려면 필요조건입니다.
3. Local Lab vs Central Lab - 장단점이 있는데 우선 Local Lab은 병원근처에 있는 Lab center를 말하는데 장점은 거리가 가까와서 쉽게 운송도 하고 결과도 빨리 볼수있지만 단점은 미국에 있는 수천 수만개의 center들의 machine들이 만든 년도 부터 다르겠고 자기 나름대로의 lab unit을 쓰기때문에 Normal range도 다를수가 있습니다. 그래서 사실 SP입장에서는 Local Lab을 쓰는경우가 골치아픕니다. 반대로 Central Lab은 몇개안되는 아주 큰 Lab에 모든 환자 Lab data를 한곳에 보내기 때문에 취급하기가 쉽습니다. 하지만 운송하는데 오래걸리고 (어디에 병원이 있느냐에 따라서) 너무나도 많은 제약회사의 Lab data 를 취급하다보니 빨리 데이타처리를 못하는경우가 있습니다. 뭐, 그래도 Central Lab이 좋은것 아니냐고 하실분이 있겠지만 우선 cost가 비싸고, 또 oncology 임상시험에서는 Lab data 를 보고 효능이 있는지 없는지를 빨리알아야 하는경우들이 있어서 어느것이 더 좋다고 하기가 힘듭니다. 병행하는경우도 꽤 많습니다, 데이타의 차이가 생기면 곤란하게되죠. Phase I & II 같이 Safety를 우선으로 하는 시험에는 central이 더 효과적일수가 있겠죠.
4. SI Unit - International System of Unit인데 프랑스어로 Systeme Internationale 라서 IS 대신 SI라고 하는것 같습니다. 3번에서 말씀드렸듯이 데이타가 여러 lab center에서 올때는 unit이 다를경우가 거의 다 입니다. 주로 CDM (Clinical Data Management) 부서에서 일일히 original unit을 SI unit으로 바꾸는 작업을 하는데 진짜 조심해야 하는것이 소숫점 하나만 달라도 Normal에서 아주 심각한 결과가 되기 때문이죠. 화학을 공부하신분들은 여러가지 unit을 잘알겠지만 10^9/L 하고 K/mm3 하고는 같은 것입니다. 하지만 Phosphate 경우에는 mmol/L 가 SI unit이라서 만약 원래 unit이 mg/dL이라면 mmol/L로 바꿔야 합니다. lab 결과만 바꾸는 것이 아니라 Normal range value들도 바뀌야 하겠죠. 사실 #2의 Grade는 주로 SI unit으로 바꾼후에 해야 합니다. 그러니까 Lab data 를 다루실때 Unit없이 그저 lab value만은 전혀 아무런 의미가 없으니 꼭 unit을 언제나 생각하고 계셔야 합니다.
5. Baseline value - 모든 lab data의 baseline value가 필요한것은 아니지만 많은것들의 baseline value가 아주 중요할때가 많습니다. 예를 들어서 한 test에 대한 baseline value가 벌써 Grade 2 였다면 그후 다른 grade 2 자체가 크게 문제가 안되지만 0 에서 2 나 3 이되면 임상시험약과 관계가 있는가를 알아보고 Grade가 올라갔을때 약복용을 중지하던가 연기를 하던가 합니다. 그리고 Shift table 이라고 해서 baseline부터 grade들이 어떻게 변하는가도 알아보는것도 있고, 굳이 Grade뿐만아니라 CFB (Change from baseline) 이라는 변수도 ADLB에 저장하는경우가 많습니다. 지금 상태가 중요한것이 아니라 baseline때보다 얼마나 바뀌었는가가 중요한거죠. 우선 baseline의 정의를 보자면 Oncology경우에는 첫 약복용 바로전의 value를 Baseline이라고 합니다.
6. Nadir - 각 환자마다 Nadir point가 다를텐데 어떤때는 우선 Nadir까지 간후에 얼마나 변화가 있는가를 알아보기도 합니다. Nadir는 주로 baseline 이후의 값중에 최하점을 말하죠. 하지만 Nadir value자체는 ADLB에 보관하지않고 필요할때마다 계산하는것이 보편적인 방법입니다.
7. Data type - 크게 봐서 4가지정도로 나누어지는데 더 많을때도 있습니다.
1) Hematology - 아무래도 Oncology에서는 제일 중요한것이라고 볼수있죠. 간단하게 말하자면 백혈구, 적혈구 라고 할수있지만 일반적으로 아는정도가 아니라 백혈구안에도 세분화되어있는 것들이 있습니다. 그래서 WBC (White Blood Cell 또는 Leukocytes) 의 세분화되어있는 것들이 있는데 예를 들어서 제일 잘쓰이는 Neutrophils 을 원래 value를 쓰기도 하고 WBC안에 몇 퍼센트인가를 쓰기도 합니다. 그래서 ANC (Absolute Neutrophils Count)는 Neutrophils의 원래의 value를 말하는거죠. Microbiology를 전공한 사람이 아니라서 아주 더 세부적인것은 잘 모르지만 online으로 찾아보시면 얼마던지 찾으실수있습니다. 임상시험에서 자주쓰는 test를 보면 RBC, WBC (Neutrophils, Basophils, Eosinophils, 등등) 어느정도는 알고계시면 좋습니다.
2) Chemistry - 보통 임상시험과 관련된 몇개만 쓰기는 하지만 그래도 Hematology보다는 익숙한 것들입니다. 그중 자주 눈여겨 봐야하는것들이 Bilirubin, Creatinine, Glucose, ALK (Alkaline Phosphatase), AST (Aspartate Aminotransferase), ALT (Alanine Aminotransferase) 이지만 그외에도 꽤 종류가 많은데 언제 쓰일지 모르는것이라서 어느정도 알고 있으면 좋죠.
3) Coagulation - 말그대로 응집상태를 알수있는겁니다. 주로 시간이 value이고 응집되는 시간을 알수있는데 임상시험마다 중요도가 다르다고 볼수있겠죠. 그리 많이 쓰이지는 않지만 summary table에 한두번 올라가는경우가 있어서 준비해야하고요.
4) Urinalysis - 소변검사죠. 많은 Test가 있지만 사실 그리 summary table에는 쓰이지 않지만 혹시라도 특별히 이상한 value가 있나를 체크하느데 많이 쓰입니다.
8. Collecting period - 임상시험마다 다르겠지만 collecting하는 기간이 여러가지입니다. Each Visit (보통 visit은 1주일이 될수도 있고 2-3 주일이 될수도 있는데 Protocol을 봐야합니다) 될수도 있고 여러 Visit을 묶어서 Cycle이라고 하는데 각 Cycle마다 collect하기도 하지만 cycle이 길어지면 2-3 cycle마다 collect하기도 합니다. Protocol을 보시면 lab collection schedule을 보실수있는데 왜 중요하냐하면 Lab data result에 따라서 Response를 정해야 하는경우가 많아서 Lab data result와 Date이 많이 비교가 되어서 그럽니다. 하지만 이런것은 ADaM level 보다는 SDTM에서 다 준비가 되어있어야 하겠지만 언제나 100% perfect 라는것은 없어서 ADaM을 만들때 체크를 해봐야 하는거죠.
어떠신가요? 다시한번 강조하지만 통계학지식하고는 전혀 관계가 없다고 봐야겠죠. 일을 하면서 혼자 터득하는경우가 거의 다 인데 문제는 SP이나 Biostat한테 Lab data에 대해서 정식으로 트레이닝을 해주는 회사는 거의 없는것 같더군요. 그러니까 모르면 열심히 회사내에 다른부서사람들한테 물어보거나 online으로 찾아보셔야 합니다. 요즘이야 internet이 발달이 되어서 아주 쉽죠, 제가 시작할때는 internet이 없었거던요. ㅎㅎㅎ 그래서 SP로 오래일을 했다고 해도 Oncology 일을 안해봤거나, 일을 했다고 해도 Lab data 를 신경써서 다루지 않은 사람들은 해야하기는 하지만 아주 골치아픈것이죠. 그래서 Lab data는 임상시험분석에 중요하지만 많은 SP들이 회피하는 것중에 하나입니다. 많은 지식과 경험이 필요하지만 그만큼 잘난척할만한 것이 아니라서 그런것같습니다. 정 싫으면 oncology 말고 device 나 백신 임상시험 일을 하시면 되겠지만 너무 오래 일을 하면 할수록 자신의 가치가 떨어질수도 있으니 주의 하시고요. 아는 한 사람은 device회사에서 13년인가 오래 manager로 일하다가 제가 다니던 전 회사에 조인하겠다고 했지만 제가 할수없이 NO를 했어야 했었던 기억이 있습니다. Device관련 임상시험이야 잘 알겠지만 워낙 Lab, AE, CM, MH등 아주 중요한 oncology 임상시험자료를 13년동안이나 다뤄보지 않았으니 뭐 초보자나 같은데 manager직을 줄수가 없어서였죠.
어떻게 보면 Lab data에 대해서 아주 잘아시면 resume에 언급을 하시거나 초보자 인터뷰할때 잘만 아는체하시면 점수를 많이 받을수있는 것이라고 생각합니다. 그러니까 통계 석사, 박사 공부하시면서 선택과목의 여지가 많으시면 이런것들을 공부하셔도 도움이 많이 될거라고 추천합니다.
|
첫댓글 우와 감사합니다 저는 LB 다루는게 제일 재밌네요. 제일 복잡하기도하고 배우는것도 많구요
10년전 12개 oncology를 합치는 iss에서 LAB을 맡았는데 거의 10개월 엄청 고생했습니다. sql만 쓰다가 짤리뻔했죠.
아 ISS. 제가 ADaM 후기로 쓰겠습니다
감사합니다. 도움이 많이 되네요 ^^
삭제된 댓글 입니다.
SP들이 제일 다루기 싫어하는 데이타죠. 그나마 의학이나 Biology, Chemistry 공부를 한사람들은 알고 들어가는것이 많겠지만 수학, 통계만 공부한 사람들은 골치아픈것중에 하나죠, 안 쓸수도없고. 저도 요즘 Client회사에 아직 SDTM데이타가 없어서 Source data 로 ADLB비슷한 analysis data를 만들어 쓰는데 데이타가 점점 더 많이 생기면서 제대로 처리 못한것들이 나타나네요.
잘 이해하시면 후에 도움이 많이 될겁니다. 저는 따로 unit이 없다거나 뭔가 문제가 될만한 것들을 찾아내는 프로그램을 따로짜서 Source data가 바뀔때마다 돌려서 우선 데이타의 문제가 없나 체크합니다. 근데 제가 Lab data를 다루다보니 잘알지는 못하지만 R로 프로그램을 짠다는것이 쉬울지 의심이 드네요. 제가 워낙 SAS에 익숙한지는 몰라도요.
@임수영 아! 요즘은 online으로 들을수 있으니까 그러면 되겠군요.
대학교에서 SAS를 안쓰게된것은 SAS회사 책임이 아주 많죠. 가뜩이나 미국에서 학교 재정들이 안좋은데 SAS회사는 license fee만 계속 올렸으니 학교에서는 공짜 프로그램을 쓸려고 했었죠. 제 두째아들이 대학원에 다닐때도 SAS를 쓰는 class가 한두개 있었지만 Matlab인가 하는 공짜 프로그램을 썼었죠. 그때는 아직 R이 보편화 안되었던 것으로 압니다.
우스운것은 제약회사에서 80-90년대에 SAS를 쓰기 시작한것이 사실 통계학 대학원에서 SAS를 많이 썼기때문이라고 해도 과언이 아닐겁니다. 앞으로 대학교에서 R만 쓰기 시작하면 앞으로 R로 대체되는것은 사실 a matter of time일지 모르죠. 어쨋던 아는것이 힘!