몇일전에 SAS Korea에서 메일을 받았었습니다.
큰 고객중 하나가 SAS를 기반으로 한 품질관리 시스템을 쓰고 있었는데, R로 시스템을 개발하여 테스트하고 있어서 고객을 잃을 위기였나봅니다. SAS Korea에는 R&D가 없어서 우째우째 저를 찾은것 같더군요.
하여간 R로 시스템을 만들면 뭐가 문제가 될지 알려달라더군요. 그걸로 고객을 설득할 생각인가봅니다.
사실 R이 open-source여서 기업용 system을 만들면 좀 불안합니다.
version-up이 상당히 자주 있는데 할 때마다 가끔 사소하게 안되는게 있습니다.
R에 딸린 package들이 많은데 그 개발자들이 그걸로 월급받는 사람도 아닌데 새로운 version에 발빠르게 upgrade할리도 없고요.
GEE라고 반복측정된 자료에 사용되는 방법이 있습니다.
R에는 gee라는 package가 있고요.
2년전인가 돌려보는데 각 개체마다 4번이상 반복측정된 자료는 돌아가는데, 아래 데이타는 세번 반복측정되었는데 안 돌아가더군요.
> data(Rail,package="nlme")
최근 버전이 2.13.0에서는 돌아가더군요. 그래서 이제 고쳤나 했더니, 어제 심심해서 paired t-test에 사용된 before-after 자료를 GEE로 돌려봤습니다. 그런데 안돌더군요.
before-after는 두번 반복된 자료죠. 그래서 개발자인 B. D. Ripley에게 메일을 보내서 알려줬습니다.
B. D. Ripley는 Oxford에 있는 유명한 사람입니다. Modern Applied Statistics with S의 공동저자고요.
방금 답장을 받았는데 황당하게도 딱 한 단어네요.
"So?"
생각해보니 2년전에 세번 반복측정된 자료에서 안돌아간다고 보고했을때도, 다른 package 사용하라는 답장을 받았었습니다.
아주 보기드믄 불친절한 인간이네요^^
첫댓글 제가 대학원에서 데이터마이닝 수업 들을때 교수님께서 Brian Ripley보고 이상한 인간이라고 했었는데 그말이 맞았군요 ㅎㅎ
"Modern applied statistics with S"의 first author인 W.N. Venables은 엄청 친절하던데 비교가 되네요.
이건 리눅스와 대형벤더사 유닉스 시스템 둘중에 어떤걸 사용 해야되느냐의 고민과 유사하네요..