적지 않은 분들이 statistics를 불신하거나 무시하려는 경향이 있는 것 같습니다. 미국에서도 statistics를 대하는 사람들의 태도는 나눠지고, 야구로 먹고 사는 사람들도 불신론자와 신봉자로 나눠지죠.
불신론자들은 '통계는 세상에서 가장 사악한 거짓말'이라는 문장을 애용하는 듯 합니다. 하지만 통계신봉자인 저로서는 '통계는 결코 거짓말을 하지 않는다. 통계를 잘못 이용하는 사람들이 거짓말을 할 뿐이다"는 말에 더욱 믿음이 갑니다.
간단한 예를 들어보죠. 1999년 어메리칸 리그의 배팅 타이틀은 .357의 타율을 기록한 노마 가르시아파라에게 돌아갔습니다. 한편 .349의 타율을 기록한 데릭 지터는 2위였습니다.[어느 선수가 더 우수하니 이런 말을 하려는 건 아니므로 민감하게 받아들이지 마시길]
그런데 두 선수의 타율을 보고 1999년 어메리칸 리그에서 가장 정확한 배팅을 한 선수는 가르시아파라라고 할 수는 없습니다. 가르시아파라의 타격 STAtisTICs는 분명 지터의 타격 STAtisTICs보다 우수하지만, 이것을 가지고 가르시아파라가 더욱 정확한 배팅을 했다고 하는 건 STATIC을 가져올 수도 있고, 거짓말이 될 지도 모른다는 것입니다.
두 선수의 타율은 고작 .008에 불과하고 이것은 600타수를 기준으로 안타 5개의 차이도 없는 것입니다. 심각한 비대칭형의 펜웨이파크에서 1개월에 1번 정도 행운이 따르는 일은 그리 어려워 보이지 않습니다. 두 선수는 동일한 시간에 위와 같은 통계를 만들었지만, 동일한 장소는 아니었고 동일한 투수를 상대로 하지도 않았죠.
.008 정도의 차이라면 구장 효과를 조정해서 또 다른 통계를 만들어버리면 오히려 지터의 우위를 만들어 버릴 수도 있으니까요. 물론 이러한 경우에도 모든 맹점을 제거할 수는 없습니다. 어차피 staTIStics는 dynamic한 것이 아니라 정지된 (static) 것이고, 이의(static)가 따르는 것이니까요.
하지만 그렇다고 해서 지터가 가르시아파라보다 더 정확한 배팅을 했다고는 할 수 있을까요? 어찌 되었든 가르시아파라는 532타수에서 190안타를 때렸으니 .357의 타율을 기록했고, 지터는 629타수에서 219안타만을 때려서 가르시아파라보다 낮은 .349의 타율을 기록했죠. 통계를 무시하거나 어떤 것을 증명하기 위해서 또 다른 통계를 들먹거리는 것은 더욱 신빙성이 없는 이야기가 될 수 있을 겁니다.
단지 통계의 정적이고 1차원적인 특성만을 고려하고 적절하게 이용한다면 어떠한 감각보다도 정확한 것이 통계입니다. 야구계의 불문율 가운데 '통계를 믿어라'는 것도 아마 이런 뜻에서 나왔을 겁니다.
통계가 어떻고 하는 이야기는 이 정도로 하고, 이제는 "Runs Created"에 대해서 간단하게 말하겠습니다. RC는 개인적으로 아주 조금 존경하는 Bill James라는 분께서 만든 것입니다. RC에도 여러 가지 버전이 있지만 최근 거의 주류가 되는 Technical Version을 기준으로 하겠습니다.
먼저 RC의 공식은 [(H + BB + HBP - CS - GIDP) * {TB + .26(BB - IBB + HBP) + .52(SH + SF + SB)}] / (AB + BB + HBP + SH+ SF) 입니다. 이전의 버전과는 달리 도루와 희생 번트, 희생 플라이의 가치 등도 모두 포함되었죠.
RC는 쉽게 말하면 OPS를 발전시킨 것이라고 할 수 있습니다. 출루와 TB를 주요 개념으로 삼기 때문이죠. 따라서 RC는 타자가 소속팀의 득점에 [얼마나 많이 기여를 했는가]를 나타냅니다. ==> 타자의 기량이나 능력이 아님.
RC의 최대 장점은 소속팀에 따라 타자가 과대평가 혹은 과소평가 받는 것이 없다는 것입니다. 보통 타점이나 득점이 중요하게 받아들이는데, 이런 것은 소속팀에 따라 영향을 받기 마련이죠.
2001년 기록 가운데 예를 하나 들어보죠. 뉴욕 양키즈의 호레이 포사다와 디트로이트 타이거즈의 바비 히긴슨의 간단한 기록은 다음과 같습니다.
타율은 같고 장타율에서 포사다가 조금 앞서지만, 히긴슨은 더 많이 출루한 것이 눈에 띕니다. 이런 경우에는 보통 24타점이나 많은 포사다가 더많은 기여를 해싸고 생각하기 마련이죠.
하지만 실제로 RC를 계산해보면(사실은 ESPN에서 보면) 히긴슨이 92.44로 포사다의 83.43보다 9점 정도 더 많은 기여를 했다고 볼 수 있습니다.(히긴슨이 포사다보다 9점을 더 기여할 수 있다가 아니라, '9점을 더 기여했다'입니다.)
그런데 이것이 포사다가 소속팀때문에 과대평가되었다고 볼 수도 없습니다. 왜냐면 RC는 Total Average나 Linear Weight, 또는 OPS 등과 달리 어떤 기준이 없습니다. TA는 1.000을 넘으면 평균 이상이고 LW에서는 +인지 -인지 갈라지고, OPS도 최대치가 5.000으로 정해져 있죠.
따라서 RC는 출장 경기수가 많거나 더 많은 타격 기회를 얻는 상위 타순의 선수가 유리합니다.([얼마나 많이 기여를 했는가]를 따지는 것이므로 당연한 이야기죠.)
포사다보다 히긴슨은 9경기 더 뛰었고, 77타석이 더 많습니다. 77타석이면 포사다의 타순으로 볼 때 18~19경기 덜 뛴 셈이죠. 그래서 히긴슨이 소속팀에 더 많은 기여를 했지만, 더 뛰어난 공격력을 가진 타자로 볼 수는 없습니다.
RC/25(혹은 RC/27)는 그런 단점을 피하기 위해 고안된 것입니다. 원래는 야구 경기는 보통 팀당 27번 아웃되어야 끝나지만, 실제 평균은 25에 가깝다고 해서 RC/25로 인데 공식은 RC * 25 / (AB - H)입니다.
이것은 생각해보면 아시겠지만 그러한 타자 9명으로 1경기에서 얻을 수 있는 점수입니다. RC/25를 계산하면 포사다가 5.95로 5.91의 히긴슨보다 근소하게 앞섭니다. 즉 효율성이라는 면에서는 포사다가 아주 조금 뛰어났지만, 실제 기여는 히긴슨이 더 많이 했다고 볼 수 있겠죠.
더 잘 알고 계시는 분은 추가해주시고, 틀린 부분이 있다면 지적하시고, 의문나는 점은 다시 .... 그리고 모든 분들 즐거운 일요일 보내세요.