일전에 소개한 그래프 3개를 그리느라 약 두주를 보냈다. 그 주요한 이유가 아래 것 때문이다.
http://blog.revolutionanalytics.com/2015/12/r-is-the-fastest-growing-language-on-stackoverflow.html
여러분들도 Subway-style-rank plot을 직접 그려보면 알겠지만, 윗 링크에 소개된 코드로 데이터를 다운 받는데만 일단 25시간 이상이 소요된다. 그리고 코드를 돌리는데 코드에 버그가 있어 이상한 데이터베이스들이 만들어 졌다. 그래서 다음단계인 그림을 그리기 위한 코드가 멈춰버렸다. 다시 이와 유사한 싸이트에서 Python 코드를 소개해서 도전했지만, 이 역시 2.x버전으로 만들어져 있어 나름 파이썬에 초보인 내가 3.0 으로 조작하기에는 너무 어러워서 다시 포기했다. 저자들에게 편지를 썼는데 회신도 없다.
그러느라 약 1주일이 같고, 나는 그사이 "RSQLite", "dplyr" 등 처음접하는 패키지와 친숙하게 되었다. 그리고 line by line으로 코드를 100% 이해하게 되고 나서야 최종적으로 그래프를 완성하게 되었고, 다시 이틀간에 걸쳐 코드를 편집해서 내 연구를 위한 데이테를 이용한 그래프까지 어제 완성을 했다. 그리고 현재는 fine tunning중이다.
내가 R을 좋아하는 이유는 이 처럼 다양한 그래프들을 미려한 색상으로 그려낼 수 있다는 것이고, 그들 그래프들이 내가 표현하고자 하는 논리들을 더욱 더 직관적이면서도 쉽게 독자들에게 설명을 해주기 때문이다.
아마 아래 그래그를 보면 왜 R을 이용해서 그래프를 그리는 능력이 필요한지를 알게될 것이다. 이 그림에서 영감을 받지 못한다면, 단언컨데, 당신은 미적 감각이 없거나 독자를 설득할 열정이 없는 사람일 것이다.
본인이 직접 아래 코드를 이용해 그린 그래프 인데, 아래 원본을 보면 더 정밀한 색감을 알 수 있다.
https://cran.r-project.org/web/packages/viridis/vignettes/intro-to-viridis.html