한 타석, 한 타석. 한 구, 한 구. 끊임없이 누적되는 기록. 하지만 숫자를 읽고 확인하는 것만으로는 기록에 담긴 의미를 쉽게 알 수 없습니다. 2017년은 KBO리그를 더욱 더 재미있게 즐길 수 있도록, 복잡한 기록을 이해하기 쉽게 풀어드립니다.
투고타저의 시작?
[스탯티즈 장시연] WBC 2회 연속 1라운드 탈락의 아픔이 컸다. 타자들의 국제무대 적응력을 강화하기 위한 해결책으로 스트라이크 존 확대가 본격적으로 논의되었고, 시범경기부터 새 스트라이크 존이 적용되기 시작했다.
그래서일까? 시즌 초라고는 하지만, 리그 타율이 수직 하락하는 등 생각보다도 투고타저 바람이 훨씬 거세다. 당장 2017년의 평균 경기시간은 3시간 11분으로 작년 3시간 24분보다 13분이나 단축되었다. 또, 리그 타율만 하락한 것은 아니다. 출루율은 .364에서 .326로, 장타율은 .437에서 .384로, OPS는 .801에서 .710으로 작년보다 큰 폭으로 하락하며 기대한 것 이상으로 거품이 걷히는 모양새다. 최근 10년으로 한정하면 타율과 출루율이 가장 낮은 시즌이 2017년이다.
* GS = 선발등판, GS_IP = 선발이닝
타율과 출루율 같은 공격지표 외에도 변화가 있었다. 최근 4년을 비교한 결과, 올해는 선발투수의 경기당 투구이닝(이닝/GS)이 5.47로 작년보다 소폭 상승했다. 반면에 경기당 투구수(투구수/GS)는 87.2개로 최근 4년 중 가장 적다. 또 선발투수의 이닝당 투구수(투구수/GS_IP)는 15.9개로 가장 낮았고, 선발투수가 가장 적은 투구수를 기록하고도 오랫동안 이닝을 책임질 수 있었다. 이는 인 플레이 된 타구가 안타로 연결 될 확률보다 아웃으로 연결 될 확률이 최근 10년 중 가장 높았기 때문일 것이다.
스탯체크
그렇다면 실제로도 스트라이크 존이 확대되었을까? 투고타저일 때 볼 수 있는 특징이 두드러졌다고는 해도 스트라이크 존 확대와는 관계가 없을 수도 있어 한 걸음 더 들어가 본 결과,
S% = 루킹 스트라이크 / (루킹 스트라이크 + 볼) X 100
최근 3년 중 루킹 스트라이크 비율이 가장 높았다는 것을 확인할 수 있었다. 즉, 투수가 던진 공이 타자의 타격 행위에 영향을 받지 않고 포수 미트에 안착한 공이 스트라이크(루킹)로 판정 받은 비율을 데이터화 한 결과, 올해가 최근 3년 중 가장 높았다는 것이다. 구심이 어느 때보다 스트라이크 콜로 바빴을 한 해였다.
OZ_S% = S존 바깥 루킹 스트라이크 / (S존 바깥 루킹 스트라이크 + S존 바깥 볼) X 100
또 스트라이크 존을 통과하지 못 한 공이 스트라이크로 판정된 비율도 최근 3년 중 가장 높다. 지난 3월 김풍기 심판위원장은 ‘존 확대는 아니고 지난해까지 좁게 본 경향이 있었음을 인정하고, 규칙상의 스트라이크 존을 적극 활용한다는 의미’라며 언론을 통해 확대해석을 경계한 바 있다. 따라서 스트라이크 존 자체가 바뀌지 않았다면 최근 3년을 동일선상에서 두고 비교하는 것이 무리는 아니다.
이 사실을 감안하면, 4~5%로 형성되던 지난 2년과 달리 올해는 시즌 초임을 감안해도 꽤 많은 볼(B)이 스트라이크(S)로 바뀌어 판정된 셈이다. 통계상 시즌 후반으로 갈수록 스트라이크 판정 비율이 높아지는 경향성을 고려하면 현재 투고타저 현상은 일시적인 현상에서 그치지 않을 가능성이 높다.
투고타저, 타고투저의 의미
wOBA(가중출루율)와 같은 세이버 스탯은 그 자체로 리그 득점환경 즉 투고타저나 타고투저 상황을 반영하고 있다. 때문에 이런 스탯을 분석할 때에는 팬이 굳이 더 가공할 필요가 없다. 개인의 취향과 관점에 맞게 반영 비율을 조정하고 의미 부여를 달리하면 될 뿐이다. 하지만 모든 스탯이 이렇게 친절하지 않다. 친절하지 않은 스탯이라면, 추가로 가공을 하든 눈대중으로라도 보정을 하든 해서 그 스탯이 가진 숨은 의미를 꿰뚫어야 할 번거로움을 맞게 된다.
BABIP(인 플레이 타구의 타율)과 DER(수비효율)의 관계
BABIP = (H-HR) / (AB+SF-K-HR)
DER = (TBF - (H + K + BB + HBP + E)) / (TBF - (HR + K + BB + HBP))
“인 플레이 된 타구의 타율”을 뜻하는 BABIP는 속칭 바빕으로 불릴 만큼 팬들에게 친숙한 세이버 스탯이다. 이 기록으로 특정 선수를 평가할 때 라인드라이브 비율과 함께 보아야 한다는 유의사항은 잘 알려져 있지만, 리그 상황까지 같이 고려해서 보아야 한다는 것은 생각보다 잘 알려져 있지 않은 듯 하다. 메이저리그면 몰라도 KBO리그는 짧은 기간에도 리그 성향이 빠르게 바뀌기 때문에 상대적으로 더 중요하다.
위 표는 투고타저로 유명한 초창기(1983~1987)와 타고투저로 유명한 2000년대 초반(1999~2003)을 비교한 것이다. 1987년에는 9이닝당 홈런(HR/9)이 0.51개에 불과했지만, 1999년에는 1.22개로 말 그대로 홈런이 무자비할 정도로 쏟아졌다. BABIP은 “인 플레이 된 타구의 타율”을 뜻하면서도, “홈런과 삼진을 제외한 타율”을 뜻하기도 한다. 원론적인 BABIP 이론만 보면 홈런이 많든 적든, 리그 BABIP 값은 홈런과 관계가 없어야 할 것 같지만 실제로 홈런이 많았던 타고투저 시즌은 볼넷(BB/9)도 많고, 삼진(K/9)도 많으면서, BABIP도 높다. 리그 타율이 높아진 것은 확인할 필요도 없이 당연한 일인데, 이때 DER(수비효율)은 당연히 낮을 수밖에 없다.
쉽게 표현하면, 수비효율은 얼마나 아웃카운트를 많이 만들어냈는지를 수치화 한 것으로 BABIP과는 기본적으로 반비례 관계에 있다. 큰 틀에서 볼 때 BABIP은 안타가 된 확률을 산출한 스탯이라면, DER은 아웃을 만들어낸 확률을 산출한 스탯이기 때문이다. 이 둘은 상호보완적이며 유기적인 관계에 있는 것이다. ‘수비수가 개입할 여지가 없는 홈런과 삼진’을 제외한 ‘인 플레이 된 타구가 안타(또는 아웃) 될 확률’은 타고투저(또는 투고타저)와 비례 관계에 있는데, 아이러니 하게도 투고타저나 타고투저를 가늠케 하는 것 중 하나가 ‘수비수가 개입할 수 없는 홈런’이기도 하다.
때문에 투고타저일 때는 BABIP이 낮고, 타고투저일 때는 BABIP이 높다는 사실을 간과해서는 안 된다. 특정 선수의 타율이 BABIP과 함께 해마다 요동치고 있다고 해서, “운의 좋고 나쁨이 해마다 널뛰고 있지만 곧 선수 통산 평균 값으로 돌아갈 것이다.” 라고 쉽게 단정해서는 안 되고, (라인드라이브 비율을 같이 활용하더라도) 당시 리그 상황이 어땠는지도 같이 살펴야 하는 것이다. 리그의 BABIP은 투고타저, 타고투저 상황에 영향을 받기 때문이며, 타자의 BABIP은 리그의 BABIP에 영향을 받기 때문이다. 더 정확히 말하면 타자의 BABIP이 모인 것이 리그의 BABIP이기 때문에 독립된 관계일 수가 없다.
LOB%(잔루처리율)
LOB% = (H+BB+HBP-R) / (H+BB+HBP-(1.4xHR))
뿐만 아니라 리그 상황은 투수의 LOB%에도 영향을 미친다. 투수의 LOB%, 잔루처리율이라 부르는 이 스탯은 투수가 출루시킨 주자가 득점되지 않고 누상의 잔루로 남은 비율을 수치화 한 것이다. 하지만 공식에서 보는 것과 같이 ‘실제 잔루처리 된 주자의 비율’을 산출하는 것이 아니라 ‘추상적으로 잔루처리 된 주자의 비율’을 산출하는 스탯으로, 선수를 예측하는 데에 사용되고 있다. 어쨌든 이 잔루처리율은 리그 평균에 따라 70~72%로 유지된다고 알려져 있고, 이 수치에서 벗어난 투수는 결국 평균으로 회귀하게 된다는 내용을 담고 있다.
주자가 쌓여있는 위기 상황에서 탈삼진으로 수비의 부담을 덜고, 그 흔한 땅볼 타점도 기대할 수 없도록 투수 본인의 힘으로 확실하게 아웃을 만들 수 있는 유형의 투수가 잔루처리율이 높게 형성된다. 96.6으로 KBO리그 역대 가장 높은 잔루처리율%(50이닝 이상 기준)을 기록한 2011년 오승환의 9이닝당 탈삼진(K/9)이 12.0이었다는 것은 우연이 아니다.
잔루처리율은 탈삼진 능력 외에도 피출루율을 같이 보아야 잔루처리율을 더 잘 이해할 수 있다. 투수의 피출루율을 4개 구간으로 나눠 그 구간에 속한 투수의 잔루처리율 평균을 산출한 위 그래프를 보면, 피출루율(X축)이 높을수록 잔루처리율(Y축)이 낮게 형성되고 있음을 알 수 있다. 왜 그럴까?
예를 들어 보자. 한 이닝에 4명씩 출루 허용하는 투수의 잔루처리율과 한 이닝에 1명씩 출루 허용하는 투수의 잔루처리율, 어느 쪽이 더 높게 형성될까? 한 이닝에 4명이나 출루를 허용하는 투수는 주루사, 병살타와 같이 주자가 사라지는 경우를 제외하면 최소 1점은 실점으로 허용할 수밖에 없다. 반면에 1명만 출루를 허용하는 투수는 폭투, 포일, 실책이 발생하거나 홈런을 허용하지 않는 이상 실점을 허용하지 않는다. 결국, 출루를 적게 허용하는 투수가 이닝이 종료될 때 이미 출루한 주자를 누상의 잔루로 만들 확률이 높을 수밖에 없다. 위 그래프는 그 사실을 뒷받침 하고 있다.
이 잔루처리율도 결국 투고타저(또는 타고투저)에 영향을 받는다. 투고타저라면 투수의 피출루율이 낮을 수밖에 없고, 이는 결국 잔루처리율이 높게 형성될 단초가 된다. 따라서 투수의 잔루처리율도 액면 그대로 70~72%가 될 것이라 받아들이면 위험하다. 그 시즌의 피출루율, 평균 잔루처리율을 같이 보아야 향후 잔루처리율, ERA를 전망하는 데에 정확도를 높일 수 있을 것이다.
끝으로
이제껏 수 많은 세이버 스탯이 개량되어 왔고, 국내에도 여러 매체를 통해 꾸준히 소개가 되고 있다. 하지만 접근성이 떨어진 탓인지 그 기록의 가치, 특정 기록을 형성하고 있는 선수의 가치를 평가하면서 고려되어야 할 것들이 무시되거나 보정되어야 할 과정이 생략되기도 했다. 2016년에 기록한 3할의 가치를 예년보다 더 낮추어 보정하려 하는 시도는 1년 내내 있어왔지만, 평균자책점 4.50의 가치를 더 높게 보정하려는 시도는 거의 찾아볼 수 없었다. 애초에 투수나 야수 일방이 유리하게 평가 받는 보정은 목격한 전례가 없는 것도 같다. 그 논리에 따르면 KBO리그는 36년째 퇴보하고 있는지도 모른다.
하지만 야구도 일방이 유리하면 다른 일방이 불리한, 일종의 제로섬 게임이다. 오늘의 스탯칼럼은 투고타저나 타고투저가 중요한 것이 아니다. 왜곡된 현상과 가려진 진실을 어떻게 바로 잡고 들춰낼 것인지 연구하는 것 또한 세이버메트릭스의 한 영역이라는 것을 이 자리를 통해 말하고 싶다.