이것은 2005년 4/20-4/22에 일어난 사건이다.
처음 맡은 프로젝트는 EPA(미국 환경청)에서 따온 것으로, R이라는 공짜 통계 프로그램을 이용해서, 독성학 실험실에서 일하는 사람들이 쓰기 쉬운 통계 package를 개발 보수하는 것이다. 모형은 Cumulative Logistic Regression이었다.
독성학 연구의 가장 쉬운 예는 화학물질을 얼마나 투여했을때 쥐가 얼마나 죽느냐이다. 9.11이후 화학전에 대비하여 이 연구가 활달하게 진행중이다.
이 프로젝트를 Ken이라는 통계학자와 일해야했다. 그 할아버지는 은퇴하고 집에 office를 만들어놓고 간간히 일하는 사람이다.
이 프로젝트를 성공적으로 수행하기 위해서는 Cumulative logistic regression이 GLM(generalized linear models)의 변형이기에 GLM이라는 통계모형을 잘 이해하고 있어야하고, 프로그램 능력이 뛰어나야한다.
그런데 이 할아버지는 비교적 최근 모형인 GLM을 배운적도 없다. 그냥 사용만 해온 것이다. 보통 사람들이 회귀분석을 아무생각없이 사용하듯이... 그리고 그 나이에 프로그램을 할 수 있을리가 만무다.
그래도 처음에는 잘 지냈다. 그냥 내가 하면되니까.
근데 문제는 이 할아버지가 별로 할 일이 없다는 것이다. 그런데 이 할아버지는 나와는 달리 contractor여서 쓴 시간을 청구해야한다. 당연히 뭔가 자기도 뭔가 일을 만들어야했다. 그래서 이렇게 해봐라 저렇게 해봐라. 참으로 많은 걸 제안했다. 잘 모르는 사람이 하는 제안이라 대부분이 짜증나는 것 뿐이었다. 내가 별로 달가와하는 표정도 아니니 기분이 좀 상했겠지...
그러던중, 이 할아버지 무슨 배짱인지 엄청난 걸 시도하려고 했다. 실험에서 투여되는 화학물질의 양을 통계모형에 넣을때 log변환시켜 사용하기도 하고 그 양 자체를 사용하기도 한다. 그런데 log를 썼을때 모수 하나를 추가하고 싶어했다.
말은 참 쉬웠다. 그런데 그게 모르는 사람한테나 쉬운거지, 장난이 아닌 작업이었다. 한달 넘게 걸리게 뻔하고 내가 보기엔 정말 생전 처음 보는 이상한 모형이었다.
사실 Crump란 사람이 1979년에 제시한 모형인데 실제로 쓰이는걸 본적은 없다. 안쓰일만한 이유가 있으니 안쓰이겠지...
그리고 이 할아버지 Crump가 어떤 방법을 썼는지 읽어볼 생각은 안하고 그냥 Maximum Likelihood Method를 쓰라고한다. SAS로 간단한걸 돌려보니 엉망이다. 할 필요없겠구나! 나는 기쁜 마음으로 보여주었다. 그러나 명백한 증거앞에서 반응이 "시키는 대로 안하고 왜 SAS가지고 시간낭비하냐!"였고 뻔히 아는 Maximum Likelihood Method에 대한 설명을 한참 늘어놨다. 기가 막혔다.
Crump가 어떤 방법을 썼는지 한번 읽어보는게 어떠냐는 제안에 자기는 확신하니 그냥 하라였다.
안되는걸 뻔히 알면서 1달동안 시간낭비를 할 수 없었다. 그래서 된다는 확신이 설 때까지 못하겠다고 했다. 그랬더니 확인한다고 EPA에 있는 통계학자에게 전화를 했다. 대답은 당연히 부정적...
얼굴이 시뻘개져서 일단 다른거 하고 다음에 다시 시도해보자고한다.
그래서 엉뚱한거 안해도 되는구나하고 기쁜 마음에 집에 왔다.
다음날은 학교에 가는 날. 그리고 그 다음 날 다시 Ken 할아버지집에 갔다.
그랬더니 난데없이 자기가 나하고 일 못하겠다고 회사에 전화했다고한다. 내가 저항이 너무 심하고 일할 의지가 없다나...
그리고 회사로부터 전화를 받았다. 군대를 예로 들며 그냥 시키는대로 하란다.
황당 억울... 이것이 그날의 기분이었다.
며칠후 Ken 할배집으로 출근했더니 David Lieberman의 Get Anyone to do anything이라는 책을 읽고 있었는지 그 책이 식탁에 놓여져있었다.
첫댓글 ㅋㅋㅋ 완전 공감합니다.전에 처음 병원에 있었을때 variogram을 찾는 작업을 했었는데, 자료를 가지고 비선형 회귀를 해서 적절한 함수를 적합시키는 거였지요. 그런데 SAS의 proc nlin 놔두고 for문을 써서 몇개 값을 대입한 후 주어진 자료하고 편차가 가장 작게 보이는 '그림'을 눈으로 고르라는 거에요. 이건 아니다 싶어 논쟁을 벌이다 밤 11시 넘었던 거 같은데... 그 할아버지가 통계학 박사인 주인장님에게 MLE를 설명하는 모습을 상상하니 그 때 매우 힘드셨겠지만 웃음이 나오네요. 시트콤도 아니고...
잘모르면서 고집 센 사람하고 일하면 피곤하죠... 게다가 잘 모르면 쉽게 무시당한다고 생각하거든요.