세이버메트릭스sabermetrics란 야구 기록의 수학적이고 통계학적인 분석이다. 세이버메트릭스라는 분야를 이해하기 위해서는 먼저 야구라는 게임에 익숙해져야 할 것이다. 야구는 미국에서 가장 인기 있는 스포츠 중의 하나이며, ‘국민적 오락’으로 불려지기도 한다. 야구는 1800년대 중반 미국 동부지역에서 시작되었으며 직업적인 야구(프로야구)는 18세기 말에 출범하였다. 내셔널리그는 1876년에, 아메리카 리그는 1900년에 설립되었다. 현재 미국에는 28개의 프로팀(역주:2002년 현재 30개팀)이 내셔널리그와 아메리칸리그에 속해 있으며 수백만의 사람들이 경기장에서, 그리고 TV를 통해 야구를 즐기고 있다.
야구라는 게임
야구는 각각 9명의 선수로 구성되는 두 팀 사이에서 벌어진다. 9명의 선수는 각각 투수, 포수, 1루수, 2루수, 유격수, 3루수, 좌익수, 중견수, 우익수로 불린다. 야구 경기는 9개의 이닝inning으로 구성되어 있다. 한 회의 이닝은 2부분으로 나누어지며 이닝의 전반부에는 한 팀은 (경기장 안에서) 수비를 하고, 다른 팀은 타석에 들어선다. 이닝의 후반부에는 두 팀은 서로의 역할을 바꾸게 된다. 이닝의 전, 후반부동안 타격을 하는 팀은 점수를 얻기 위해 노력하며 9이닝의 마지막에 더 많은 점수를 얻게 되는 팀이 경기에서 이기게 된다.
이닝이 진행되는 동안 투수라 불리는 수비측 선수는 타자라 불리는 공격측 선수를 향에 야구공을 던진다. 타자는 배트bat라 불리는 나무 방망이를 이용하여 수비하는 선수들이 닿을 수 없는 곳으로 공을 쳐내기 위해 노력한다. 공을 친 후에 타자는 경기장에 놓여져 있는 4개의 베이스를 통과할 수 있는 기회를 얻게 된다. 공격 측 선수가 모든 베이스를 다 돌았다면 그는 득점을 한 것이다. 타자가 친 공이 수비수에게 잡힌다거나, 그가 1루에 도달하기 전에 공을 1루로 던지면 타자는 아웃out됐다고 하며, 득점을 올릴 수 없게 된다. 타자는 투수가 던진 공을 3번 헛치거나 스트라이크strike라 불리는 좋은 공 세 개를 그냥 지나쳐버리면 또한 아웃 된다. 공격하는 팀의 목표는 한 이닝 동안 세 번의 아웃을 당하기 전에 가능한 많은 점수를 얻는 것이다.
기본적인 타격 통계
야구경기의 주목할만한 점 중 하나는 경기 중에 기록되는 수치화된 정보가 무척이나 풍부하다는 점이다. 투수와 타자의 효율은 일반적으로 수치화된 특정한 지표에 의해 평가된다. 타격 효율에 관한 일반적인 평가방법은 안타의 수를 타수로 나누는 방식으로 계산하는 타율batting average이 있다. 이 통계는 전체적인 기회(타수)에 대한 성공(안타)의 비율을 나타낸다. 한 시즌동안 가장 높은 타율을 기록한 타자는 그 시즌의 수위타자(타격왕)이라 불리게 된다. 타자들은 또한 (각각 단타, 2루타, 3루타, 홈런으로 불리우는) 하나의 안타로 각 베이스(1루, 2루, 3루, 홈)에 출루할 수 있는 능력을 평가 받기도 한다. 장타율slugging average은 타자의 총루타total bases를 타수로 나누어서 계산한다. 이 지표는 한번의 안타로 도달한 베이스의 수를 가중하여 계산하기 때문에 타자가 장타를 칠 수 있는 능력을 나타낸다. 야구에서 가장 값진 안타는 하나의 안타로 총 4개의 베이스를 진루할 수 있는 홈런이며, 한 시즌에 가장 많은 홈런을 기록한 선수는 야구팬과 언론에게서 특별한 대접을 받는다.
기본적인 피칭 통계
투수를 평가하는 데에도 몇 가지의 통계가 사용된다. 개개인의 투수에 대해 그가 승리투수 혹은 패전투수로 기록된 경기의 수와 그가 허용한 득점이 기록된다. 일반적으로 투수는 9이닝 당 평균 자책점(방어율: ‘earned’ runs allows; era)라는 개념에 의해 등급이 매겨지게 된다. 다른 통계들도 투수의 능력을 이해하는 데 유용하게 사용된다. 투수는 타자가 그가 던진 공을 경기장으로 쳐내는 데 실패했을 때 삼진strike out을 기록하게 되며 그가 타자에게 4개의 부정확한 공balls을 던져 타자가 출루하였을 때 사사구(볼넷: a walk)을 기록하게 된다. 공을 매우 빠르게 던질 수 있는 투수는 많은 수의 삼진을 잡을 수 있으며 제구력이 불안정한 투수는 많은 수의 사사구를 기록하게 될 것이다.
개량된 타격 능력 지표-Runs Created
세이버메트릭스의 목표 중 하나는 타격과 피칭 능력에 대한 정확한 평가방법을 발견하는 것이다. 빌 제임스Bill James(1982)는 1960년대에 활약했던 자니 페스키Johnny Pesky와 딕 스튜어트Dick Stuart를 비교해 보았다. 페스키는 타율은 높지만 홈런은 거의 치지 못했으며 반대로 스튜어트는 타율은 그리 높지 않았지만 매우 많은 수의 홈런을 기록하였다. 그렇다면 누가 더 가치있는 타자일까? 타자는 그의 소속팀을 위해 득점을 생산해 낼 수 있는 능력에 의해 평가받아야 한다고 제임스는 주장했다. 그는 매우 광범위한 타격 데이터를 이용한 경험적인 연구를 통해 한 시즌 동안 기록한 안타와 볼넷, 타수, 토탈 베이스를 기반으로 하여 단일시즌동안 올릴 수 있는 득점의 수를 예측하는 다음과 같은 공식을 고안해냈다.
이 공식은 야구에서 득점을 올리는 데 있어서 중요한 두 가지 측면을 반영하고 있다. 팀의 안타와 볼넷의 수는 주자를 출루 시키는 팀의 능력을 나타내며 팀의 토탈 베이스는 이미 출루해 있는 주자를 진루 시킬 수 있는 팀의 능력을 반영한다. 이 run created 공식은 개인적인 수준에서 한명의 선수가 그의 팀을 위해 생산할 수 있는 득점의 수를 계산하는 데 사용될 수도 있다. 1942년에 페스키는 620타수에 205 안타, 42 볼넷과 258개의 토탈 베이스를 기록했다. 공식에 따르면 페스키는 그의 팀을 위해 96득점을 생산해냈다. 1960년대의 딕 스튜어트는 532타수에 160안타, 34 볼넷, 309 토탈 베이스를 기록하였으며 그의 run created는 106점이다. 1960년의 스튜어트는 1942년의 페스키보다 팀을 위해 조금 더 많은 득점을 생산해 냈으며 따라서 스튜어트가 페스키보다 좀 더 나은 타자라는 결론을 내릴 수 있다.
선형 가중치
타격 능력을 평가하는 또 다른 접근법으로는 선형 가중치 공식을 이용하는 것이 있다. 조지 린지George Lindsey(1963)는 최초로 팀이 공격을 하고 있는 동안에 일어날 수 있는 각각의 사건들이 득점에 공헌하는 각각의 가치를 부여하는 방식을 개발했다. 야구경기에서 기록된 데이터와 확률 이론을 바탕으로 하여 다음과 같은 공식을 고안했다.
1B, 2B, 3B, HR은 한 게임에서 기록된 각각의 단타, 2루타, 3루타, 홈런의 개수를 나타낸다. 이 공식의 주목할만한 점은 타자는 세가지 방식으로 득점을 생산할 수 있다고 인식한 것이다. 타자가 안타를 치고 출루를 하면 직접적인 득점 가능성이 잠재되어 있는 것이다. 덧붙여 이미 주자가 출루해 있다면 타자는 주자를 진루 시킬 수 있으며 아웃을 당하지 않았기 때문에 타자는 다음 타자에게 안타를 쳐낼 수 있는 기회를 제공하는 것이다. 이것은 간접적인 득점 가능성이라 할 수 있다. 쏜Thorn과 팔머Palmer(1993)는 게임 도중 기록되는 모든 공격 이벤트를 기반으로 평균적인 야구팀이 생산하는 득점을 예측하는 좀 더 복잡한 선형 가중치 공식을 발표했다. 제임스의 run created처럼 선형가중법칙 역시 개별 선수의 타격 능력을 평가하는 데 사용될 수 있다.
승리를 위한 득점
득점을 올리는 것은 야구 경기에 있어서 중요하지만, 팀의 기본적인 목표는 상대팀보다 더 많은 득점을 올리는 것이다. 득점과 승수사이의 관계에 대한 연구에서 제임스(1982)는 많은 수의 메이저리그팀이 최근 기록했던 한 시즌 동안의 득점과 실점의 수, 승수와 패수를 조사했다. 제임스는 한 팀의 승수와 패수와의 비율은 대략적으로 팀의 득점과 실점사이의 비율을 제곱한 값에 근사한다는 점에 주목했다.
이 상관관계는 타자가 팀을 위해 만들어낸 승리의 수로 표현되는 타자의 능력을 평가하는 데 사용될 수 있다.
개량된 피칭 능력 지표
세이버메트릭스는 피칭능력을 평가하는 더 나은 방법 또한 개발해왔다. 대표적인 피칭 통계라 할 수 있는 승수와 9 이닝당 자책점(방어율:ERA)은 결함이 있다. 투수의 승수는 단지 투수가 속한 팀의 공격력을 반영할 수 있을 뿐이다. 방어율은 투수의 효율성을 등급 매겨 평가하지만 전체적인 시즌 동안 그 투수의 실제적인 공헌을 제대로 나타내지는 못한다. 쏜과 팔머는(1993) 다음과 같은 Pitching run 공식을 고안해냈다.
League ERA
PITCHING RUNS = Innings pitched:투구이닝 * --------------- - ER:자책점
9
(리그 방어율/9)라는 요소는 리그의 모든 팀의 이닝 당 평균 실점을 나타낸다. 이 변수에 투수가 투구한 이닝의 수와 곱해야 하는데, 이것은 투수가 평균적인 수준이라면 시즌동안 허용할 실점의 수를 나타낸다. 마지막으로 투수가 그 시즌에 기록한 자책점을 빼준다. Pitching runs이 0보다 크다면 이 투수는 평균 이상이라고 할 수 있다. 이 새로운 평가방법은 투수의 효율성과 내구성을 평가하는 데 유용한 것으로 나타나고 있다
야구 선수들의 타격, 피칭, 수비 능력에 대한 평가 방식들은 계속적으로 개선되어 왔다. 그러나 이런 통계들은 팀의 승리에 대한 개별 선수들의 기여도를 직접적으로 측정할 수 없다. 베넷Bennett과 플뤡Flueck(1984)은 홈팀이 경기를 이길 확율을 측정하기 위하여 run differential(홈팀 득점 ? 원정팀 득점), 이닝의 절반(이닝의 초, 말), 아웃의 수, 주자가 출루한 상황이 주어진 두 시즌 동안의 데이터를 이용했다. 이렇게 추정된 확률은 각각의 게임 상황에 따라 승리할 확률이 변한다는 것을 알게 해준다. 이를 이용하면 선수가 참여하는 개별적인 플레이에 의해 승리할 변화하는 확률을 합산하여 그 선수가 게임을 승리하는데 기여한 정도를 평가할 수 있다. The player game pecentage라고 불리는 이 통계는 조 잭슨Joe Jackson의 타격 성과를 평가하기 위하여 베넷(1993)에 의해 사용되었다. 잭슨은 1919년 월드 시리즈에서 고의적인 승부조작에 가담했다는 혐의를 받고 야구계에서 추방되었다. The player game pecentage를 이용한 통계적 분석은 1919년의 월드시리즈에서 잭슨은 그의 모든 잠재력을 발휘하여 플레이 하였다는 것을 보여줬다.
조정하기
사람들은 곧잘 서로 다른 시대에 활약했던 타자나 투수들을 비교하는데 관심을 가진다. 이런 비교를 하는데 있어서는 타격, 피칭 통계를 그들이 이루었던 성취를 동일한 맥락에서 살펴보는 것이 중요하다. 예를 들면 빌 테리Bill Terry는 1930년 .401의 타율로 내셔널리그 타격 1위를 차지하였으며 이후 그보다 더 높은 타율을 기록한 경우는 현재까지 단 한번에 불과할 정도로 대단한 업적이었다. 1968년에 칼 야스트렘스키Carl Yastrzemski는 .301의 타율로 아메리칸리그 타격 1위에 올랐다. 표면상으로 보자면 테리는 야스트렘스키보다 월등히 훌륭한 타자이다. 그러나 그들과 동시대에 활약했던 타자들과의 상관성을 살펴보았을 때 두 명의 타자 모두 당시의 평균적인 타자보다 약 27%정도 높은 타율을 기록한 것으로 나타났다(쏜과 팔머, 1993). 1930년도에 테리가 이루었던 타격의 성취는 1968년도에 야스트렘스키가 달성했던 것과 실제로 매우 비슷하다. 마찬가지로 서로 다른 구장에서의 타격은 많은 차이가 있으며 타격 통계는 선수들간의 정확한 비교를 위해 그들이 경기한 구장간의 차이를 감안하여 조정할 필요가 있다.
제한적인 데이터로부터 얻을 수 있는 것
야구경기를 보고있노라면 통계분석에 대한 흥미를 불러 일으키는 몇 가지 의문들이 생기게 된다. 야구 경기를 중계방송 하는 동안에 아나운서는 의례적으로 선수에 대한 선택된 타격 기록들을 얘기해준다. 예를 들면, 경기 중에 배리 본즈Barry Bonds는 최근 몇 경기에서 20타수 10안타를 기록하고 있다는 얘기를 듣게 된다. 이 정보에 근거하여 본즈의 타율에 대하여 얻을 수 있는 것은 무엇일까? 명백하게, 본즈의 타율이 10/20=.500 정도로 높을 리가 없다. 이 데이터는 화면에 제시되는 퍼센티지를 최대화하기 위해 선택됐기 때문이다. 카셀라Caella와 버거Berger(1994)는 이러한 제한적인 정보를 근거로 하여 선수의 진정한 타율을 구하기 위한 가능 함수를 구성하고 최대 기대치를 산출하였다. 그들은 이러한 제한적인 데이터로는 전체 시즌동안 축적된 타격 기록을 포함하는 ‘완전한 데이터’로서의 타율에 대한 통찰력을 얻기가 힘들다고 결론지었다.
불규칙성?
또 다른 흥미로운 이슈는 타격 기록에서의 불규칙성의 존재이다. 한 시즌동안 몇몇 야구 선수들은 많은 수의 안타를 쳐내는 타격감이 최고조(‘hot hitting’)에 달하는 기간을 경험하는 것이 관찰된다. 다른 타자들은 좀처럼 안타를 치지 못하는 기간이나 슬럼프를 경험하게 된다. 그러나 이러한 타격 는 동전 던지기를 할 때 나타나는 자연적으로 발생하는 변수를 반영하는데 지나지 않을지 모른다. 알브라이트Albright (1993)는 타격 데이터에서의 불규칙성을 찾아내기 위하여 방대한 타격 데이터를 조사하고 득점 같은 통계수치를 사용하였다. 그는 일반적으로 타격에 있어서 이러한 불규칙으로 성적이 분포되는 것에 대한 확실한 통계적 증거를 찾을 수 없다고 결론지었다.
상황별 데이터
요즘은 많은 팬들과 매체들이 상황별 데이터에 지대한 관심을 기울이고 있다. 타자의 타격성취는 주간/야간 경기, 천연/인조 잔디, 우완투수와 좌완투수, 홈/원정경기 같은 서로 다른 상황 속에서 기록된다. 이러한 형태의 데이터에 대한 통계적 분석은 두 가지 기본적인 문제가 존재한다. 먼저, 특정한 상황은 타격 데이터상의 무수히 많은 양의 변수들을 설명할 수 있을까? 두 번째로 주어진 상황 하에서 특별히 뛰어난 능력을 발휘하는 야구 선수가 존재할까? 알버트Albert (1994)는 활자화된 많은 수의 상황별 데이터를 분석하고 다양한 선수집단으로부터 추출한 데이터를 종합하기 위하여 계층적 베이스 모형(Bayesian hierarchical models)을 이용하였다. 그의 기본적인 결론은 몇가지 중요한 상황이 존재한다는 것이다. 예를 들면 좌완투수와 우완투수를 상대할 때의 타율이 .2 정도 차이가 나거나 홈구장에서의 타율이 .08 정도 높은 타자가 있을 수 있는 것이다. 그러나 이러한 상황별 효과에 따른 개인적 차이를 입증할만한 통계적 증거를 그다지 많이 않다.
예측
메이저리그 야구는 현재 6개의 지구(division)으로 나뉘어져 있으며 각 팀의 목적은 그들의 지구에서 1위를 차지하는 것이다. 시즌의 일부가 진행되었다고 가정한다면, 부분적인 시즌 기록을 이용하여 지구 1위 팀을 정확하게 예측하는 것이 가능할까? 배리Barry와 하티건Hartigan(1993)은 팀이 개별 경기를 이길 확률을 계산하기 위해 선택적 모형을 이용하였다. 이 모형은 팀 간의 차이점, 서로 다른 홈 어드벤티지, 시간에 따라 무작위적으로 변하게 되는 팀의 강점을 고려한다. 저자는 이 모델을 이용하여 미래의 야구 경기를 시뮬레이션하고 팀이 각각의 지구에서 승리할 가능성을 예측한다.
현재, 메이저리그 야구 경기는 매우 세밀하게 기록되고 있다. 경기 중에 투수가 던진 공 하나하나 마다 타구와 개별 수비 플레이에 관한 정보들이 기입되며, 야구 통계의 방대한 데이터베이스가 축적되고 있다. 이러한 데이터베이스는 여러가지 방법으로 사용되고 있다. 각 팀의 홍보부서는 이러한 데이터를 이용하여 소속 선수들에 대한 특별한 통계자료를 출간한다. 또한 통계자료들은 메이저리그 선수들의 연봉을 결정하는데도 사용된다. 특별히 통계적 정보는 연봉을 결정하는 법적 절차인 연봉조정 과정에서의 근거로 사용된다. 몇몇 팀들은 전문적인 통계분석가를 고용해왔으며 일부 감독들은 경기 중 전략을 결정하는데 통계적 정보를 이용하기도 한다. 빌 제임스를 비롯한 다른 세이버메트리션들은 통계분석이라는 수단을 사용하여 야구 경기에 관한 다양한 의문들에 대답하는 것이 가능하다는 것을 보여주고 있다.
References
Albert, J. (1994), "`Exploring baseball hitting data: what about those breakdown statistics?", Journal of the American Statistical Association , 89, 1066-1074.
Albright, S. C. (1993), "A statistical analysis of hitting streaks in baseball," Journal of the American Statistical Association , 88, 1175-1183.
Barry, D., and Hartigan, J. A. (1993), "Choice Models for Predicting Divisional Winners in Major League Baseball," Journal of the American Statistical Association , 88, 766-774.
Bennett, J. M. (1993), "Did Shoeless Joe Jackson Throw the 1919 World Series?", The American Statistician, 47, 241-250.
Bennett, J. M. and Flueck, J. A. (1984), "Player Game Percentage", in Proceedings of the Social Statistics Section, American Statistical Association, 378-380.
Casella, G. and Berger, R. (1993), "Estimation With Selected Binomial Information or Do You Really believe that Dave Winfield is Batting .471?", Journal of the American Statistical Association , 89, 1080-1090.
James, B. (1982), The Bill James Baseball Abstract, New York: Ballantine Books.
Lindsey, G. (1963) "An Investigation of Strategies in Baseball," Operations Research, 11, 447-501.
Thorn, J. and Palmer, P. (1993), Total Baseball, New York: Harper Collins.
빌 제임스는 세이버메트릭스를 “객관적인 야구 지식의 추구”라고 정의했다. 즉 세이버메트릭스는 “레드삭스팀의 공격에 가장 큰 공헌을 하는 선수는 누구인가?”, 혹은 “켄 그리피 주니어Ken Griffey jr.는 다음 시즌 홈런을 몇 개 칠 것인가?” 하는 객관적인 질문에 대답하기 위해 노력한다. 그것은 “당신이 가장 좋아하는 선수는 누구인가?”, “그 게임은 정말 대단했어” 같은 야구를 즐기는 데 있어서 역시 중요하다고 할 수 있는 주관적인 판단은 다루지 않는다.
통계는 야구경기에 있어서 가장 객관적인 기록이며 세이버메트릭스는 통계를 주된 평가수단으로 사용한다. 물론 통계는 그것을 정확히 이해할 수 있을 때만 유용한 것이기 때문에 세이버메트릭스의 많은 부분은 통계를 얼마나 적절하게 사용할 것인가, 목적에 적합한 통계는 어느 것인가 하는 등의 문제를 이해하는데 연관되어 있다. 이것은 당신이 세이버메트릭스를 이해하기 위해서 많은 수학적 지식이 필요하다는 것을 의미하지는 않는다. 당신은 그저 통계들이 어떻게 사용되고, 어떤 경우 잘못 이용되는 지에 대해 이해하고 있으면 된다.
야구에서 사용되어 지는 통계는 관찰에 의해 수집된 기록이다. 야구팬이나, 스포츠 기자 혹은 야구선수나 감독이라 할지라도 한 시즌동안 모든 팀의 경기를 많아야 13번 정도 볼 수 있을 뿐이다. 그의 관찰은 어느 정도 흥미로울지는 모르나 매우 작은(그리고 대부분 편중된) 샘플이다. 13경기에서는 훌륭한 타자와 그렇지 못한 타자간의 차이는 단지 안타 5개에 불과하며, 관찰자가 어떤 평균적인 선수의 시즌 중 가장 타격감이 좋았던 두 경기를 보게 된다면 그는 그 선수의 능력에 대한 부정확한 인상을 얻게 될 것이다.
반면, 선수 개개인의 통계는 리그의 공식기록원에 의해 관찰된, 그가 출장한 모든 경기에 대한 기록이다. 이것은 직접적인 관찰에 의한 수집의 경우보다 방대하며 보다 쉽게 이해할 수 있는 형식으로 전환할 수 있다. 야구팬들은 한 타자의 타율을 구하기 위해 그 선수의 600타석을 모두 지켜볼 필요는 없을 것이다.
세이버매트릭스는 야구에 대한 객관적인 연구이기 때문에 세이버메트릭스의 논의에 있어서 논리적 추론을 이용하는 것이 필요하다. 그러므로 통계나 관찰 또는 당신이 가진 정보로부터 가설이 도출될 수 있으며, 직접적으로 증명할 수 없는 주장은 그것에 수반되어 지는 결론을 연구함으로써 평가할 수 있다.
“피칭은 야구의 X%이다”-흔히 X는 15에서 80사이로 알려져있다.- 라는 진술을 예로 들어보자. 당신이 “피칭은 야구의 75%이다”라고 주장한다면, 그리고 그것이 사실이라면 당신은 타격이 좋은 팀보다 피칭이 좋은 팀이 정규시즌에서 우승할 것이라고 결론 내릴 것이다. 그러나 사실은 그렇지 않다. (피칭과 수비를 포함한) 리그 최소 실점팀이 정규시즌 우승을 한 경우는 대략 절반 이하 정도이고 (모든 타격 요소를 포함한) 리그 최다 득점팀이 우승한 경우를 더 자주 볼 수 있다. (공격의 정의부분에서 살펴보겠지만 타율 같은 불완전한 통계를 사용하여 타격을 평가할 경우, 피칭의 중요성은 더욱 과대평가될 것이다.) 이것은 또한 예를 들어, 피칭의 비중이 75%를 차지하는 팀에서는 주전급 타자를 얻기 위해 주전급 투수를 트레이드하는 일은 절대 일어나지 않을 것이라는 잘못된 결론을 이끌어 낸다. 그러나 75%라는 수치가 40%정도로 조정된다면 그 결론은 합리적이 될 것이다. 세이버메트릭스 논쟁은 실제로 이렇게 벌어진다.
2. 일반적인 원칙
야구팀의 목적은 다른 팀보다 많이 이기는 것이다. 한 팀이 다른 팀의 승수에 영향을 미치는 것은 거의 불가능하기 때문에 그 목적은 근본적으로 가능한 한 많은 경기를 이기는 것이 된다. 그러므로 개개의 선수가 팀의 승리에 기여하는 정도를 측정하는 것은 흥미로운 일이다.
팀의 득, 실점과 승패 사이에는 명확한 상관관계가 있으며 완벽하지는 않지만 매우 유의미하다. 빌 제임스는 팀의 승률은 팀의 득점과 실점사이의 비율을 제곱한 것에 비례한다는 공식을 데이터로부터 경험적으로 도출해 냈다. 이 공식에 따르면 팀의 득점과 실점이 같은 팀은 승패역시 같은 수, 즉 .500 정도의 승률을 올릴 것이고, 800득점과 700실점을 기록한 팀은 49번 패배하는 동안 64번을 승리할 것이며 한 시즌으로 환산하면 92승 70패를 기록할 것이다. 이 공식은 대부분의 팀의 실제성적과 매우 일치한다.
세이버메트릭스의 기본적 목표는 주어진 목적을 위한 척도를 평가하는 것이다. 통계는 대부분 과거의 성취(누가 MVP를 받아야 하는 가 같은)를 평가하는 데 사용되어지거나 미래의 결과(트레이드의 득실을 따져보는 등의)를 예측하기 위해 쓰여진다. 두 경우 모두, 우리는 경기의 승패에 대한 기여도를 측정하는 데 관심을 가진다.
이러한 분석이 가능한 이유는 통계를 작성하는 일이 다른 스포츠보다 야구에서 더 흥미롭기 때문이다. 야구 통계는 다른 선수들과는 독립된 개개인의 성취를 측정할 수 있다. 그리고 개인적인 사건의 중요성은 그가 처한 상황에 달려 있는 반면 전체 시즌과 같은 거대한 샘플에 기반한 통계자료에 특정한 상황이 차지하는 비중은 그리 크지 않다. 타자가 안타를 쳤을 때 이는 그가 실제로 한 것을 나타낸다. 쿼터백이 10야드 패스를 던졌을 때 라인백커를 수비하는 가드는 어떠한 통계적 의미도 가지지 못한다. 안타를 친 타자는 성공에 대한 적절한 평가를 받지만 13야드가 남아있는 써드 다운에 성공한 10야드 패스는 실패로 기록될 것이다. 그러므로 득점과 승리에 대한 개인적인 기여도를 측정하는 것은 야구 통계의 목적에 있어서 합리적인 것이다.
목적이 주어지면 통계를 평가하는 것이 가능하다. 야구 통계는 일반적인 통계와 같은 방식으로 평가할 수 있으며, 또한 같은 방식으로 오용되거나 잘못 해석되어질 수 있다.
통계에 대한 가장 기본적인 의문은 “통계는 특정 목표에 대한 기여도를 측정할 수 있는 가?”이다. 예를 들어 방어율(ERA)은 대부분의 투수가 팀이 승리하는데 기여하는, 투수가 허용한 실점을 측정한다. 타율(BA)은 안타의 수를 세기 때문에 꽤 공정하지만 공격의 부분에서 역시 중요한 볼넷이나 장타력을 무시한다. 발생 빈도가 높지 않은(몸에 맞는 볼(HBP)같은) 것에 대한 통계나 승리하는데 그다지 중요하지 않은 것(타자의 아웃 중 삼진이 차지하는 비율), 혹은 이 두가지가 모두 관련된 것들 같은 몇몇 통계는 이런 점에서 치명적이다. 일반 통계를 예로 들자면 작년에 한 도시에서 발생한 범죄수는 그 도시의 치안을 평가하는데 중요하지만, 특정 거리에서 발생한 범죄의 수로 도시 전체의 치안에 대해서는 설명할 수 없다.
두번째로, 가장 중요한 의문은, “諛兀? 선수 개개인의 기여도를 얼마나 정확하게 측정할 수 있는가”이다. 야구와 연관되어 있거나 그렇지 않은 많은 통계 방식들은 이 점에서 실패할 수 있다. 실제로 모든 통계들은 그것을 확장할 때 어느 정도의 결함을 가지게 되고 따라서 좋은 통계는 단지 소수의 결함만을 지니고있거나 그것들이 상대적으로 적은 것이다.
예를 들면 선수는 그의 동료나 감독이 아닌 자기 자신이 한 것으로 평가 받아야 한다. 이것은 득점과 같은 통계가 가지고 있는 중요한 문제점이다. 타자가 홈런을 치거나 홈스틸을 하지 않는 이상 실제로 득점을 하기 위해서는 동료의 도움이 필요하며, 그가 안타로 1루에 진루한 이후에는 득점하기 위해 할 수 있는 일은 별로 없다. 그러므로 당신이 만약 리그 최고의 홈런타자 앞에서 타석에 들어선다면 당신이 득점할 수 있는 능력과는 상관없이 많은 득점을 할 수 있을 것이다. 감독이 당신을 내셔널리그팀의 8번 타순에 배치한다면 당신은 출루하더라도 많은 득점을 올리지 못할 것이다. 이처럼 좋은 통계들은 구장과 같은, 선수가 통제할 수 없는 외부효과를 포함시켜서는 안된다.이러한 문제에 관한 일반 통계의 예는 마이애미의 높은 사망률을 들 수 있다. 마이매미 인구에서 고령자가 차지하는 비중은 다른 대부분의 도시보다 높기 때문에 마이애미의 의료서비스 수준에 상관없이 높은 사망률을 예측할 수 있다.
오클랜드에서보다 펜웨이파크에서 득점하기는 보다 쉽다. 그러므로 오클랜드에서 3.60의 방어율을 기록한 투수는 펜웨이에서도 비슷한 수준의 투구를 하여 그의 팀이 승리하는데 기여한다해도 그는 4.00의 방어율을 기록할 것이다. 당신은 때때로 구장 조정수치(앞서 말한 효과를 제거하기 위해 고안된, 예를 들면 위의 투수는 두 구장 모두에서 3.80이라는 구장효과가 조정된 방어율을 가질 것이다.)에 대한 토론에 대해 들어보았을 것이다. 이것은 투수의 성취에 대한 가치를 조정하는 것이지 실제의 성취를 뜻하는 것은 아니라는 것에 주의해야 한다. 4.00의 방어율의 레드삭스 투수는 홈과 원정경기에서의 차이가 얼마든지에 상관없이 그의 팀에서 그 정도의 가치가 있는 것이다.
만약 어떤 선수의 기록이 그가 팀이나 구장을 옮긴다던지, 타순의 위치가 바뀌었을 때 상당한 변화가 있다면 이는 그 기록에 외부효과가 상당히 많은 작용을 한 것이라고 볼 수 있다. 만약 외부조건의 변화에도 기록이 일정하게 유지된다면 이것은 선수 자신의 기여도가 온전히 측정되고 있다는 것을 의미한다. 방어율이 좋은 투수는 팀을 바꾸더라도 여전히 방어율이 좋은 경향이 있기 때문에 구장효과는 그다지 큰 문제는 아니다. 선두타자로서 많은 득점을 기록한 타자가 6번으로 타순을 옮긴 후 득점이 줄어들었다면 이것은 그가 기록한 득점은 그의 능력보다는 타순의 위치에 많은 영향을 받았다는 것을 의미한다.
외부효과와 관련된 문제와 더불어 평가방법의 문제 역시 중요하다. 예를 들면 어떠한 통계도 동일한 전후상황 속에서의 측정기회가 주어지지 않는다면 쓸모없게 된다. 뉴욕의 범죄발생건수가 보스턴보다 많았다고 해서 두 도시간의 상대적 치안수준을 비교할 수는 없다. 그러한 비교를 위해서는 (인구당)범죄발생율을 비교하는 것이 필요하다.
타자가 150안타를 기록했다면 이것은 무엇을 의미하는가. 그가 500타석에 들어섰다면 그는 훌륭한 타자이지만 650타석에 들어섰다면 그리 훌륭한 타자는 아닌 것이다. 이것은 대부분의 통계에 관련된 문제점이다. 타율은 안타수를 합리적인 맥락 속에서 평가한다고(타자가 들어선 타석수를 고려하기 때문에) 인식되어 지며 따라서 타격왕 타이틀은 최다안타를 기록한 선側? 아니라 최고의 타율을 기록한 타자에게 주어진다.
이와 비슷하게 매우 작은 크기의 샘플에서 추출됐거나 발생 빈도가 미약한 통계 역시 그리 유용하지 않다. 자주 완봉을 하는 훌륭한 투수라도 리그 완봉 순위에서 1위를 하지는 못하는 경우가 있는데, 이는 리그 완봉 1위는 대개 약 5번 정도의 완봉을 기록하지만, 한해에 보통 3번의 완봉을 하던 선수가 7번의 완봉을 기록할 수도 있기 때문이다. 반대로 삼진을 잘 잡는 투수(또는 9 이닝당 삼진수가 높은 투수)는 삼진 리그 1위를 차지할 가능성이 매우 높은데 이는 총 삼진 개수가 100단위이기 때문이다. 240이닝에 250개정도의 삼진을 잡을 수 있는 투수는 230개의 삼진을 잡을 수는 있지만 삼진수가 150개로 떨어지지는 않는다.
이러한 문제는 일반 통계에서도 일어난다. 한 도시에서 응답자 중 2/3가 민주당에 투표할 예정이라고 밝힌 여론 조사결과에서 2/3라는 수치가 6명 중 4명이라면 아무런 의미도 갖지 못할 것이고 60명 중 40명이라 해도 큰 의미를 가질 수는 없다. 그러나 600명 중 400명이라면 통계는 상당히 큰 의미를 가질 것이다.
이것은 TV에서 자주 사용되는 많은 통계가 가지고 있는 큰 오류이다. “웨이드 보그스Wade Boggs의 볼티모어 투수를 상대로 한 득점권 타율은 .154이다.”라는 통계는 보나마나 13타수 2안타 정도 되는 샘플일 것이기 때문에 아무 의미가 없다. 세이버메트리션sabermetrician은 대부분의 팬들처럼 그러한 수치가 우스꽝스럽다는 데 동의한다. 그것은 (통계적으로 무지한) TV 시청자들의 관심을 끌기 위한 것에 지나지 않는 것이다.
승리를 위한 선수의 기여도를 측정하는 통계에 대해 어느 정도 이해했다면 마지막 질문은 “더 나은 방법은 없는가”이다. 앞서 말한 두 가지 사항에 대한 문제점은 가지고 있지만 합리적인 대안이 존재하지 않는다면 통계는 여전히 유용하다. 반대로 득점처럼 다른 통계로 대체될 수 있는 것이라면 그 의미는 매우 적다. 한 선수의 팀득점에 대한 그 자신의 기여는 출루하는 능력(출루율에 의해 상당히 정확히 측정될 수 있다)과 조금 더 확장하여 스스로 진루할 수 있는 능력(장타율, 도루와 도루자로 평가된다)에 의해 평가될 수 있다.
이러한 기준이 주어져 있다면 당신은 통계적 결론을 평가할 수 있다. 당신이 결론을 논의함에 있어 이러한 기준에 기반하고 있다면 당신의 논점은 유효할 것이다. 즉 당신은 통계에 의해 측정되지 않은 무언가, 혹은 측정되지만 그럴 필요가 없는 무언가를 발견할 필요가 있다. 예를 들어 마이크 슈미트Mike Schmidt가 548개의 홈런과 1507개의 볼넷을 기록했기 때문에 그의 통산 타율이 .267에 불과하다 할지라도 훌륭한 타자라고 주장할 수 있다. 이것은 타당한 주장인데 타율은 홈런과 안타를 동일하게 평가하지만 볼넷은 전혀 포함시키지 않기 때문이다. 또한 아지 스미스Ozzie Smith는 그다지 뛰어난 타자는 아니었지만 그의 수비능력 때문에 훌륭한 선수로 평가 받는다. 어떠한 타격 통계도 야구 선수로서의 그의 전체적인 가치를 평가할 수는 없는 것이다.
그러나 통계에 이미 포함되어졌거나 당신의 주장에 의해 부적절하게 평가된 어떤 것에 기반한 주장으로 통계적 결론을 내릴 수는 없다. 브룩스 로빈스Brooks Robinson이 2848 안타를 기록했기 때문에 훌륭하다고 말하는 것은 비합리적이다. 그가 어떻게 안타를 기록했는 지에 대한 척도는 그의 .267의 타율이며 그는 장기간에 걸친 선수생활을 가능케한 다른 능력 때문에 많은 안타를 기록한 것이기 때문이다. 위에서 말한 예를 보면 .527의 장타율에도 불구하고 그의 낮은 통산타율 때문에 마이크 슈미트를 평가절하 할 수는 없다. 타율은 이미 장타율 안에 같이 계산되었기 때문이다.
개인의 공격 능력에 대한 훌륭한 통계는 위에서 말한 기준을 어떤 전통적인 공격지표보다도 만족시킬 수 있는 가치있는 통계일 것이다. 따라서 세이버메트리션은 그러한 통계들을 이용하거나 혹은 고안해내기도 한다. (투수의 능력을 평가하는 데에는 투수가 허용한 실점을 계산하는 ERA와 득점허용(Run Allowed)라는 지표가 존재하기 때문에 그러한 통계의 필요성은 덜하다.)
팀 전체적으로는 공격능력에 대한 좋은 통계는 팀의 득점과 매우 큰 상관관계를 가지고 있어야 한다. 이것은 그 자료를 이용하여 팀의 득점을 합리적으로 예측하는 것이 가능해야 한다는 것을 의미한다. 이 지표가 높은 팀은 많은 득점을 올려야 하고, 가장 낮은 팀은 가장 낮은 득점을 올려야 한다. 타율과 같은 지표는 그렇지 못하다. 팀타율이 가장 높은 팀이 평균이하의 득점을 올리는 것은 흔히 있는 일이다. 득점은 그 자체로 팀의 공격력을 매우 잘 나타내는 확실한 평가방법이지만 그것은 개개인의 기여도를 측정하는 데 있어서는 문제점을 가지고 있다. 타자가 팀의 득점에 기여한 정도를 직접적으로 평가하는 것은 쉬운 일이 아니다.
팀의 공격력을 평가하기위해 고안된 통계에는 몇가지가 있다. 주자를 출루시키고, 그 주자를 진루시킴으로써 득점을 얻는 것은 야구의 가장 기본적인 방법이다. 따라서 팀의 득점은 출루하는 주자의 수와 그 주자가 진루하는 빈도와 비례관계에 있어야 할 것이다. 출루율(OBP)은 베이스에 있는 주자의 수를, 장타율(SLG)은 이미 출루한 주자의 진루를 평가하는 한가지 방법이다.(아웃은 누상의 주자가 진루할 가능성을 낮추기 때문에 장타율을 감소시킨다) 즉 팀의 득점은 OBP*SLG와 상관관계가 있어야 한다.
이런 종류의 통계는 실제 기록에 얼마나 근사하느냐로 평가해 볼 수 있다. 팀의 OBP*SLG를 총 득점과 비교해 보면 매우 높은 상관관계를 발견할 수 있으며 표준오차는 단지 24득점에 불과하다. 실제로 비교해보면 한시즌 득점의 표준편차는 70득점인 반면(이러한 오차는 모든 팀의 득점이 평균수준에서 동일할 것이라고 가정할 경우 발생한다.) 타율만의 표준오차는 54득점이다. 24득점이라는 표준오차는 베이스런닝 같은 요소나 공식 자체의 불완전성 때문에 OBP*SLG가 측정하지 못하거나 불완전하게 측정하는 모든 것을 나타내고 있다. 그러나 이러한 차이의 대부분은 가능성이다.
선수 개개인의 기여도를 평가하여 개인적인 통계를 만들어보자 OBP*SLG는 선수 스스로 득점을 생산해 내는 일이 드물기 때문에 정확한 지표가 될 수 없다. 대신 선수의 OBP에 팀 SLG를 곱하거나 선수의 SLG에 팀의 OBP를 곱해 볼 수 있다. 대개의 경우 리그 SLG(그리고 개별 팀의 SLG)는 OBP의 약 1.2배이므로 한 선수 의 OBP 1 포인트가 OBP*SLG에 미치는 영향은 자신의 SLG 1 포인트가 OBP*SLG에 미친 영향의 1.2 배로 계산해야 한다. 이제 우리는 (1.2*OBP)*SLG라는 식을 얻게 되었다. 단순화하기 위해서 1.2라는 수치는 종종 무시되며 이 식은 OPS(출루율+장타율, On base plus Slugging)라 불리고 있다. 이 통계를 사용할 때는 OBP는 약간 낮게 평가되었으며 도루는 고려하지 않았음을 감안해야 한다.
비슷한 과정을 통하여 공격의 여러 요소들에 다양한 가치를 부여하는 지표들을 제공하는 여러가지 모델을 얻을 수 있다. 어떠한 지표를 사용할 것인가 하는 선택은 개인적인 기호나 이용 가능한 자료, 그것을 이용해 얻고자 하는 바에 따라 달라질 수 있다. 하지만 잘 고안된 공격지표를 이용하면 그 결과는 그다지 달라지지는 않을 것이다. 어떤 선수의 Runs Created (RC)가 다른 선수보다 2점 높게 나왔다면 이 선수는 다른 선수보다 0.03 정도의 OPS 가 하락할 것이나 이런 차이는 별로 신경 쓰지 않아도 된다. RC, OPS 어떤 방법으로도 두 선수의 가치가 비슷하다는 결론에 도달하기 때문이다.
완벽한 공격력 평가방법은 볼넷, 홈런, 득점, 아웃으로 구성되는 개인적인 범주들의 가치를 매우 잘 나타내준다. 선수가 기록한 홈런의 가치는 OPS나 비슷한 통계에 영향을 미치며 홈런의 중요성은 (홈런이 경기 중에 가지는) 가치와 그 빈도에 달려있다.
4. 공식기록 평가
이제 우리는 공식적인 통계에 우리의 기준을 적용하려 한다. 굳이 모든 통계에 대해 논의할 필요는 없으며 가장 활발한 논쟁을 불러일으키는 통계들을 살펴보는 것이 보다 효율적일 것이다.
타점(RBI)은 개인의 공격력에 대한 지표로 널리 사용되는 데 이는 쉽게 사용될 수 있고 또 완벽해보이는 유일한 통계이기 때문이다.(이런 이유로 MVP 수상자는 다른 어떤 기록보다도 리그 타점왕일 가능성이 높다.) 물론 그것은 완전한 척도는 아니다. 득점을 올리는 능력은 공격의 중요한 부분이지만 전체는 아니다. 물론 이는 타점을 의미없게 만드는 것은 아니며 단지 불완전하다는 의미이다.
그러나 타점의 실제문제는 두번째 원칙에 관련 된 것이다. 그것은 선수 개개인의 기여도가 아닌 많은 것들을 평가한다. 누상에 주자가 없으면 홈으로 불러들일 수 없고(홈런은 제외), 스스로의 타격으로는 자신이 아닌 주자는 진루 시킬 수가 없다. 만일 좋은 선수가 자신의 타순 앞에 위치한다면 그는 많은 기회를 얻을 것이다. 사실 대부분의 타점 순위 선두들은 주자가 득점권에 있을 때 가장 잘 치는 선수가 아니라, 동료들이 누상이나 득점권에 진루해 있을 때(타자의 능력이 아닌) 자주 타석에 들어서는 선수일 가능성이 높다. 그러므로 타점이란 누가 가장 잘 주자를 홈으로 불러들일 수 있는 가가 아니라 누가 더 주자를 득점 시킬 기회를 가졌는가 하는 지표이다.
이제 3번째 원칙을 검증해보자. 주자를 홈으로 불러들이는 능력을 평가하는 더 나은 지표가 있다. 단타는 득점권(2, 3)에 있는 주자를 불러들이고, 따라서 많은 단타를 기록한 선수는 득점권에 있는 주자를 불러들이는 능력이 좋은 것이다. 또 장타(2,3루타)는 1루에 있는 주자를, 홈런은 타자 자신을 홈으로 불러들인다. 장타율은 단타, 장타, 홈런을 칠 수 있는 능력, 즉 타점을 올릴 수 있는 능력을 나타내며 구장효과만이 변수로 작용할 뿐이다. 따라서 RBI 는 유용한 공격력 측정법이 아니며 주자를 득점케 할 수 있는 능력에 대한 평가 방법 조차 아니다.
비슷한 문제점을 가지고 있는 통계로서는 투수의 승패가 있다. 투수의 승패를 방어율과 비교해 보면 투수의 목표는 경기를 이기는 것이고 이기기 위해서는 상대팀의 득점을 억제해야 하기 때문에 두 통계는 명백히 중요하다고 할 수 있다. 그러나 두 가지 모두 이러한 문제점과 관련된 그들의 가치를 비교해보면 투수의 능력을 평가하는 데 몇 가지 한계가 있다.
첫번째 문제점은 실점은 투수만의 책임이 아니라 전체적인 수비의 책임이라는 것이다. 이것은 승패에 좀 더 관련된 것이다. 방어율은 실책으로 인한 실점은 제외하지만 수비수의 잘못된 위치 선정, 느린 걸음, 약한 송구로 인한 실점까지 제외하는 것은 아니다. 그러나 메이저리그 수준에서 이건 심각한 문제는 아니? 좋은 투수는 수비가 형편없는 팀에서도 좋은 방어율을 유지할 수 있다.
승패기록은 구장효과에서 자유로운 몇 안 되는 통계이다. 각각의 구장에서 벌어지는 각각의 경기는 하나의 승리와 하나의 패배가 기록된다. 방어율은 구장효과와 관련이 있는데 이는 구장효과를 감안하여 조정할 수 있다.
그러나 가장 중요한 요소는 팀 공격의 영향이다. 공격은 방어율과는 거의 상관 없지만 승패에는 주목할만한 영향을 미친다. 경기는 투수 혼자서 이길 수 없으며 실점보다 많은 득점을 한 팀이 이기게 된다. 단일 시즌 동안에는 리그에서 승패기록이 가장 좋은 투수는 최소 실점을 허용한 투수라기보다는 단지 가장 많은 득점 지원을 얻은 투수에 지나지 않을 수 있다. 그리고 득점 지원은 투수의 영역(내셔널리그를 제외하고)이 아니다. 만약 동료들이 보다 많은 득점을 할 수 있게 만드는 투수가 있다면 그 투수에게 좋은 평가가 내려지는 게 당연하겠지만 이런 일은 일어나지 않는다. 한 시즌에 팀 평균보다 더 많은 득점지원을 받는 투수가 다음 시즌에서도 그렇게 되는 경우는 없다. 공격력이 좋은 팀의 투수라 할지라도 팀의 공격력을 통제할 수는 없다.
득점지원의 영향 때문에 단일 시즌의 승패는 투수 자신의 가치를 평가하는 좋은 기준이 아니다. 방어율의 경우는 승패보다는 좀 더 나은 평가방법이다. 그러나 상당히 광범위한 크기의 샘플을 이용하면 통산 승패 기록은 득점지원에 있어서 운이 차지하고 있는 부분을 감소시킨다. 게다가 자신의 선수경력을 좋은 동료들과만, 혹은 나쁜 동료들과만 보낸 투수는 거의 없다. 따라서 수 백번 정도의 승패를 기록한(decision) 경기를 포함하는 통산 승패기록은 투수의 능력을 평가하는 강력한 기준이며 구장효과를 감안하지 않은 통산방어율과 마찬가지로 유용하다.
지금까지 우리는 타격과 투구의 가장 일반적인 지표들을 다뤄왔릿?가장 일반적인 수비지표를 살펴보자. 수비율(FA, Feilding Average)은 첫번째 원칙에서 문제가 있다. 수비는 중요하지만 불완전한 수비지표는 그렇지 않다. 가장 많은 에러를 범하는 3루수의 경우 대개 한 시즌에 30개 정도의 에러를 저지르고 수비율 1위의 3루수는 약 10개의 에러를 기록한다. 이는 매우 많은 득점의 차이를 만드는데 충분하지 않다. 수비에 있어서 더 중요한 능력은 안타를 막아내는 능력이며 공이 3루수가 닿을 수 없는 곳으로 빠져나가거나 그 공을 잡았다 놓치는 경우, 이는 에러로 기록되지 않지만 타자는 에러와 같은 효과를 가지는 안타를 기록하게 된다.
에러는 삼진이 타율에 미치는 영향 만큼이나 수비력의 척도로서 유용하다. 이는 하나의 플레이를 전개하는데 실패했다는 의미로써, 매우 분명한 실수로 여겨지며 전광판에 (각각의 에러가) 동등하게 합산되어 기록된다. 타자가 공을 방망이에 맞춰 타구를 날렸을지라도 평범한 땅볼 타구, 또는 내야 플라이를 많이 생산한다면 그를 형편없는 타자로 부르듯이, 에러를 많이 기록하든 적게 기록하든 수비 범위가 좁은 야수는 형편없는 수비수로 인식되어야 한다.
또한 수비율은 구장 효과 및 기록원의 편견이라는 문제를 갖고 있는데, 그로 인한 불완전성이야 말로 매우 심각한 문제점이라 할 수 있다. 하지만 이는 몇 가지 유용한 점을 측정해주고, 수비 범위가 좁을지라도 다른 부분에서 뛰어난 수비수는 에러를 많이 기록하지 않는 경향 (수비율은 승수와 밀접한 상관관계가 있다.) 이 있으므로 다른 측정법이 존재하지 않는다면 여전히 쓸만한 방법이긴 하다. 특히 매우 낮은 수비율을 기록하는 선수는 자신의 포지션을 제대로 소화해내지 못했다는 결론을 도출해주므로 어느 정도의 가치를 가지고 있다 할 수 있으나 이는 자살(put out), 보살(assist), 그리고 숫자 속에 내재된 어떤 편견들을 이해하려는 노력과 함께 연계하여 쓰여져야만 한다.
따라서 우리는 수비율을 필요 없게 만드는 종합적인 수비력 측정법, Defensive Average (DA)를 이용한다. DA의 기본은 그라운드 내의 한 부분을 야수가 책임질 수 있는 구역으로 구분하는 것이다. 타구가 야수의 구역으로 다가갈 때 그 수비수는 자신의 구역을 책임질 기회가 부여되므로 아웃으로 연결시킨다면 그 선수는 하나의 플레이를 성공시킨 것으로 여겨진다. 따라서 3루 베이스 주위를 지나가는 모든 땅볼은 3루수의 책임으로 귀결시킬 수 있다. 수비가 좋은 3 루수라면 이들 타구 대부분을 처리할 것이다. 만약 그 3루수가 타구 처리에 실패했다면 악송구 (실책으로 기록)를 범했든, 또는 지연 처리 (안타로 기록)를 했든 결과는 동일한 효과를 가져온다. 따라서 수비율은 더 이상 쓰일 필요가 없어진다.
DA 역시 다른 통계와 마찬가지로 위에서 살펴본 원칙을 이용하여 검증해야 하지만, 첫 번째 원칙부터 무난하게 통과할 수 있다. DA는 수비수의 능력으로 처리할 수 있는 범위 내에서 진행중인 타구를 아웃시키는 능력을 측정하는 것이지만 병살타를 만들어내는 능력과 안타를 치고 헛점을 노려 다음 베이스로 계속 질주하는 주자를 송구로 아웃시키는 능력 등은 포함하지 않는다. 또한, 구장 효과에 기인한 몇 가지 문제점을 안고는 있지만, 두 번째 원칙도 훌륭하게 만족시킬 수 있다. 왼손 투수라면 3 루수쪽 땅볼, 좌익수쪽 플라이볼을 많이 얻어냄으로 타구의 방향을 한 쪽으로 치우치게 한다. 그러나, 훌륭한 투수들은 타구의 강도를 약화시킴으로써 수비수들의 DA를 약간 도와줄 수 있다 (이런 모든 영향은 어떤 수비 평가법에서도 문제를 야기시킬 수 있다.). DA는 현?사용 가능한 수비 평가법 중 가장 우수하므로 세 번째 원칙도 쉽게 만족시킨다. 이것이 완벽하다고 할 수는 없어도 꽤 정확하게 이용될 수 있기 때문이다.
위에서 살펴봤듯, 전통적이라는 이유로 사용되는 통계는 훌륭한 평가 방법 (ERA 같은 것)일 수도 있고 형편 없는(RBI같은 것) 것일 수도 있다. 이들 통계의 가치는 전통성 또는 명성에 의해 좌우될 수 없으며, 단지 통계의 기본적인 원칙을 얼마나 잘 지키고 있느냐에 따라 그 가치가 정해질 것이다.
5. 기타 세이버메트릭스 논쟁
유사한 분석은 통계적 논쟁에 기인한 가설을 평가하는데 쓰여져야만 한다. 어느 한 가설이 실제 야구 경기에 부합하지 않는 결론을 도출해 낸다면 그 가설은 수정될 필요가 있다.
예를 들어 한 선수의 마이너리그 기록이 그 선수의 메이저 리그에서의 향후 성적을 예측하는데 얼마나 잘 이용되는가와 같은, 야구팬이라면 한번쯤 해볼만한 질문을 들 수 있다. 극단적인 구장 효과, 그리고 리그 간의 차이점으로 인해 마이너 리그 성적을 이용하는 데에는 문제점이 있다. 그러나 선수의 마이너 리그 성적을 이러한 효과에 대입하여 AA나 AAA 그리고 메이저와의 차이점에 적용시켜 보면 꽤 의미 있는 결론을 도출해 낼 수 있을 것이다. 이러한 작업을 정확히 수행 할 수 있는 수단이 있는데, 이를 Minor-League Equivalency, MLE 로 부른다. 이 작업이 제대로 진행된다면 꽤 유용할 뿐더러 미래의 메이저리그 성적을 예측하는 데에 있어 과거의 메이저리그 성적만큼이나 효과적이다. MLE를 이용한 평가에서 .300을 친다는 예상이 나왔다면 이 선수는 지난해 메이저 리그에서 .300을 쳤던 대부분 선수들처럼 다음해 신인으로 .300에 근접한 타율을 올릴 수 있다(물론 둘 중 어떤 예상도 완벽하진 않다).
세이버메트리션들이 연구하는 (또한 토론하는) 또 다른 이슈는 클러치 히터가 과연 존재하느냐는 점이다. 클러치 상황에서의 안타는 클러치 히터들을 존재케 한다. 바비 톰슨Bobby Thomson, 칼톤 피스크Carlton Fisk, 버키 덴트Bucky Dent, 커크 깁슨Kirk Gibson, 조 카터Joe Carter가 쳤던 유명한 홈런, 그리고 켄 그리피가 지난 5월, 8회에 쳐낸 동점타는 확실히 중요한 순간에 나온 타구들이다. 많은 선수들은 긴박한 순간에 최고의 타격을 선보일 선수라는 명성을 얻고 있다. 그리고 이것 역시 "이러한 능력을 갖춘 선수들이 정말 있는가?" 와 같은 질문을 통해 검증해 봐야 할 가설이다.
클러치 히팅 능력이란 것이 전혀 존재하지 않는다면, 또는 클러치 히팅 능력이 정말로 주목할 만한 능력이라면 실제로 어떤 일이 일어났는지, 또 어떤 일이 일어날 것인지 다시 한 번 지켜볼 필요가 있다. 아무리 명백한 .250 타자라도 시즌 옛?경기 후반의 1점차 승부에서 .400을 칠 수도 있으나 이러한 클러치 상황에서의 기회를 얻을 확률은 80타수 중 3%정도 밖에 안 된다. 따라서 이런 식의 수치는 아무것도 증명해주지 못한다. 하지만, 클러치 히팅 능력이란 것이 실재한다면 과거의 클러치 상황에서 잘 쳤던 타자들은 앞으로도 계속 잘 칠 것이다. 이러한 것은 계속적으로 분석되어질 수 있고, 또 분석되어 왔다. 다만 그 능력에 대한 통계적 검증이 매우 미약했으며 야구라는 장르에서 커다란 의미를 가지지 않는다는 점은 확실하다. 좋은 클러치 히팅 능력 덕으로 .268 타자와 실질적으로 같은 가치를 갖는 .267 타자도 있을 수 있다. 하지만 여기서 .268를 .275로 바꿔서 생각해 보면 현실 세계에서는 이러한 일이 별로 일어나지 않는다는 결론에 다다를 것이다.
6. 결론
야구 통계는 경기에 대한 이해를 높여줄 때만 유용하다. 그러므로 경기에서 실제 일어나는 일을 얼마나 잘 평가 할 수 있느냐에 따라 통계는 평가 받는다. 의미 없는 통계는 무시되어야 하며 다른 것으로 교체되어야 하고, 불충분한 통계는 향상되어야 한다. 그리고 잘 고안된 통계는 경기와 선수에 대한 토론의 중요한 부분으로 이용될 수 있을 것이다.
Bibliography
Bill James, The Baseball Abstract, published annually from 1980 to 1988 by Ballantine Books.
John Thorn and Pete Palmer, The Hidden Game of Baseball, New York:Doubleday, 1985.
John Thorn and Pete Palmer, eds., Total Baseball, New York:HarperCollins, 1993.
첫댓글 이건 좀 기니..언제 직장이나 학교에서 삐댈때 보기 딱 좋습니다. / 퍼가실분은 마음대로 퍼가세요~ 출처는 제가 아니라 저 통계학자+수학자들일터이니...
수고 많았당... 어휴~골뽀게진당~~ㅋㅋ
좋은글 잘보고 또 퍼간다...^^ 개인적으로 많이 도움이 될것 같네... 지현이 수고...^^b