축구 통계 분석
과거와 미래의 왕 (The once and future king)
- 메시와 호날두의 득점 중요성 분석 -
축구계의 라이벌은 오고 가지만 엘클처럼 치열한 건 없다. 지난 22일 바르샤는 2위 레알과의 승점을 4점차로 벌리며 2-1로 승리했다. 리그 우승 레이스와 비슷하게 레알의 스타 호날두는 31골을 기록하며 32골의 메시를 바짝 추격했다.
호날두가 2009년 당시 최고의 이적료로 레알에 입단한 후, 호날두와 메시는 적어도 한 해에 두 번 만나게 됐고, 축구에 있어 최고의 선수들로 여겨졌다. 둘의 순위는 엎치락뒤치락 했다. 메시는 2009년부터 4연속 발롱도르를 받았고 지난 두 번은 호날두가 받았다. 이러한 1인자의 변화에는 약간의 미스터리가 있다. 득점이 곧 통화(currency)인 스포츠에서는, 13-14년엔 호날두가 메시보다 돈이 더 많이 됐던 셈이다.
그러나 모든 득점이 같은 것은 아니다. 득점시의 상황에 따라 가치가 달라진다. 1-1의 동점상황에서 90분에 들어간 골은 그 자체로 승리를 안겨다 주기도 하고, 어떤 득점은 3-1 상황에서 그저 덧붙여지기도 한다. 득점이 높고 낮은 영향력을 갖고 있다고 가정하고, 그 표본만 충분하다면 특정 선수들의 레벨을 분석할 수 있다.
득점의 영향력을 적절히 분석한다면 그 빈도수 만큼 중요하게 고려될 수 있다. 그리고 이것을 정밀하게 조사한 결과, 발롱도르 투표자들은(적어도 득점에 의해 결정을 내린 사람들은) 실수를 범한 것으로 나타났다. 메시가 이른바 "내리막"이었던 지난 2년간, 바르셀로나와 아르헨티나는 비교적 많지 않은 메시의 86골로 더 많은 수혜를 입은 것으로 나타났다. 레알과 포르투갈이 호날두의 105골로 얻은 이익보다 말이다.
득점 상황에 따라 골을 분석하는 통계 기법은 승점 추가 기대값(Expected Points Added, EPA)라 부르며 야구에서 개발된 승리기여확률(Win Probability Added)을 응용한 것이다. 2001~13년 까지 프리미어리그의 4,000경기를 분석한 결과를 바탕으로 SoccerStatistically.com에선 경기 장소, 남은 시간, 득실차에 따라 팀의 승률을 예측하는 프로그램을 제공한다. 득점 직후 이 확률이 어떻게 변하는가를 통해 각 득점이 얼마나 상황을 바꾸었는지(즉, 가치있는지를) 알 수 있다.
예를 들어서 위에서 언급했던 상황을 생각해보자. 홈경기에서 90분에 비기고 있었다면 승리할 확률은 11%, 비길 확률은 82%, 질 확률은 8%이다. 각각 이길 확률에 3, 비길 확률에 1, 질 확률에 0을 곱하면 기대 승점(expected points, EP)은 1.13점이다. 반면 한 골을 추가했을 때 이길 확률은 95%, 비길 확률은 5%이며 기대 승점은 2.89점이 된다. 둘 사이의 차이인 1.76점이 바로 이 중요한 골의 승점 추가 기대값(EPA)이 된다. 또 다른 상황인 홈경기에서 2점차로 앞서고 있는 경우엔 승리 확률이 99.7%이고 비길 확률은 0.3%이다. 한 골을 더한다고 해도 EPA는 0.0007점밖에 안되며, 이는 전자의 득점에 비해 250배나 적다.
이 단순한 계산에서 수정이 필요한 건 페널티킥의 경우 뿐이다. 한 팀이 파울을 하자마자 상대팀의 기대 승점은 득점의 EPA에 평균 페널티킥의 성공률을 곱한 만큼 증가한다. 09-10 시즌 라리가의 페널티킥 성공률은 78%였다. 지정된 키커가 이를 성공시키면 상승한 기대 승점 만큼 EPA가 증가하지만, 실패할시 78%만큼 차감된다.
예를 들어 레알의 3월 1일 홈경기를 보자. 52분까지 무득점이었던 레알의 기대승점은 1.6점이다. 비야레알이 파울을 범했을 때, 레알은 78%의 득점 성공률을 더해 기대승점이 2.46점으로 0.86점 상승한다. 호날두가 페널티킥에 성공했을 때, 0.19점의 EPA를 얻는다.(이는 상승한 0.86점의 남은 22% 즉, 평균 패널티킥 실패확률이다.)
반면 4월 24일의 바르셀로나와 맨시티의 2-1 상황에서 종료를 4분 남긴 시점의 기대승점은 2.9점이었다. 시티가 파울을 범했을 시, 0.10점의 EPA와 78%의 득점 확률을 고려할 때 바르샤의 기대승점은 2.98점이 된다. 그러나 메시가 득점에 실패했을 때, 바르샤의 기대승점은 원래대로 돌아가고 메시의 EPA는 0.08점이 깎이게 된다.
그럼 이러한 분석을 2013년과 2014년의 라리가, 챔스, 월드컵에서 득점한 두 선수의 모든 골에 적용하면 어떻게 될까? 호날두의 우위는 모두 사라진다. 포르투갈의 자존심인 호날두의 105골은 레알과 포르투갈에 41.6점의 기대승점을 안겨줬고 골당 0.40점의 승점 추가 기대값(EPA)를 갖고 있다. 지난 챔스 준결승과 결승에서 3득점으로 2연속 발롱도르를 수상했어도, 그 영향력은 미약했다. 뮌헨과의 2차전에서 호날두는 레알이 이미 3-0(합계점수 4-0)으로 앞설 때 득점을 했고, EPA는 총 0.29점이었다. 결승에선 레알이 이미 3-1로 앞서고 있을 때 추가시간에 페널티킥으로 득점을 했고 이는 0.004점의 EPA밖에 되지 않는다.
반면 슬럼프라고 여겨지는 메시는 86골에서 40.3점의 기대승점을 얻었고 이는 골당 0.47점의 승점 추가 기대값을 갖고 있다. 메시는 중요할 때 득점하는 놀라운 능력을 보여줬다. 2013년과 14년에 메시는 다섯 번의 상황에서 종료 20분을 남기고 결승골을 성공시켰다. 달리 말하면 메시의 득점수가 호날두에 비해 20% 부족하지만 득점의 중요성이 20% 더 앞서는 것을 고려한다면 충분이 상쇄할 수 있다는 말이다.
게다가 이러한 통계 조차도 메시 득점 타이밍의 우월성을 모두 입증할 순 없다. 어떤 대회인가에 따라 득점의 중요성도 달라진다. 메시의 득점은(특히 결승골의 경우) 팀의 가장 중요한 대회에 집중되어 있다.
경기의 중요도를 평가할 수 있는 간단한 방법은 없다. 오직 열성적인 클럽 서포터만이 라리가가 월드컵보다 중요하다고 할 것이다. 그러나 월드컵이 '얼만큼' 더 중요한지 정확히 말할 수 있을까? 한 가지 가능한 방법은 시청자수를 측정하는 것이다. 영국에서 이미 사용되고 있는 통계를 보면 잉글랜드의 참가여부와 공중파 혹은 위성중계 여부를 고려할 때, 챔스 경기의 경우 조별예선은 프리미어리그 만큼의 가치를, 결승전의 경우 세 배의 가치를 지녔다.
월드컵의 경우엔 4.7배의 가치를 지녔으며 이는 챔피언쉽에 비교하면 15.2배이다. 이러한 방법을 적용하면 엘클의 경우 한 쪽의 승리가 자신들에겐 승점 3점을, 반대에겐 3점을 잃는 다는 것을 감안했을 때 두 배의 가치를 지니고 있다.
이러한 맥랙적인 요소를 감안했을 때, 비로소 메시의 우월한 퍼포먼스의 진가가 드러난다. 경기의 중요성을 적용한 경우, 2013-2014 메시의 EPA는 발롱도르 위너의 50.4점(골당 0.48)에 비해 59.5점(득점당 0.69점)으로 격차가 벌어진다.
EPA를 봤을 때, 지난 2년간 메시의 가장 가치있는 득점은 중립구장에서 91분에 기록한 결승골이었다. 메시의 이 결정적인 한 방은 라리가의 약체를 상대로 기록한 것이 아니라, 월드컵 조별예선의 이란을 상대로 한 득점이었다. 이 경기의 경우 4.7배의 중요성을 지닌다. 메시는 또한 나흘 후 나이지리아 전에서 두 번의 동점 상활을 깨뜨리는 골을 성공시켰다.
반면 호날두는 월드컵동안 가나와의 경기에서만 한 차례 득점에 성공했다. 이 득점은 영향력마저 미미했다. 비록 결승골이었지만 포르투갈이 조별예선에서 미국을 재치려면 4골이 필요했기 때문이다. 결국 호날두의 공헌은 그의 조국이 일찍 고향으로 돌아가는 것을 막지 못했다. 그 경기가 4골차에서 3골차로 좁힌 것으로 여겨진다면, 호날두의 2년간 EPA는 43.6으로 떨어지고 이는 메시보다 27% 낮은 수치이다.
메시의 팬들은 이 분석 결과를 과대해석하지 않도록 주의해야 할 것이다. 먼저, 득점은 축구의 일부일 뿐이기 때문이다. 경기의 절반은 수비이고, 이 계산에서는 완전히 빠져있다. 공격에서도 플레이메이킹 능력(패스 스킬과 수비의 시선을 분산시키고 팀에게 공간을 열어주는 것)도 득점 만큼 중요할 수 있다.
게다가 득점만을 따진다고 하더라도, 이 통계는 메시가 호날두보다 중요할 때 득점한다고 말하는 것은 아니다. 일반적으로 스포츠에 있어 중요한 상황에서 능력이 향상되거나 감소하는 것을 일컫는 대범함(clutch)과 소심함(choking)은 반복적인 능력이나 결점이 아니다.
충분한 샘플이 있다면 선수의 중요한 상황에서의 퍼포먼스는 대게 그들의 전체적인 기여와 비슷하다. 어떤 선수는 항상 게임이나 시즌이 위태로울 때 평균보다 잘 하고 혹자는 아니겠지만, 이 편차는 분산을 거의 초과하지 않는다. 메시와 호날두가 엘클이나 반드시 이겨야하는 경기의 마지막 순간에 어떤 퍼포먼스를 보여줄 것인가를 예측하기 위해선, 그들의 현재 컨디션과 상대방을 고려하여 지난 몇 해간 모든 경기의 평균적인 결과를 분석해야 한다. 과거 엘클이나 중요한 경기만을 분석하는 것이 아니라 말이다.
그럼에도 불구하고 기술적인 측정에만 의존하여 메시가 현재 득점 선두에 오른 것을, 부진했던 폼(메시의 기준에서)에서 회복한 증거라고 여기는 사람들은 실수를 범한 것이다. 메시는 정말로 올해 세계에서 최고로 가치있는 득점을 하는 선수이다. 메시는 2013, 2014년에도 그랬고 알다시피 그 이전의 4년간도 그러했다. 발롱도르 투표자들은 아마도 지난 2년간 "메시 피곤증"에 시달렸을지도 모른다. 그러나 바르셀로나와 아르헨티나의 서포터들은 분명 아니었을 것이다.
원문: http://www.economist.com/blogs/gametheory/2015/03/statistical-analysis-football
첫댓글 고생하셨습니다. 잘 봤어요 ㅎㅎ
어마어마한 글이네요 ㄷㄷ
메멘
오 잘봤습니다
economic 한 분석. 축구는~ 과학이다!
장차 이에 근거한 선수 평점이 나올 수도 있겠네요.
다만, 골에만 제한된 평가지만.
ㄷㄷㄷ 대단하네 번역고맙습니다
메멘....
메멘...하나의 참고자료일뿐이죠
진짜 좋은 글이네요 잘 읽었습니다!
승리 기여 오류가 있네요
2:1로 이기는 경기운영과 3:1로 이기는 경기운영은 차이가 나죠
2:1는 비길지도 모르니 꾸준히 뛰어야 하지만, 3:1이면 경기운영을 편하게 가져가면서 다음 경기 대비도 할 수가 있죠,
아슬아슬한 상황에서의 팀원들의 체력소모와 넉넉한 상황에서의 팀원들의 체력소모라는 변인을 넣거나, 다득점 이후 경기의 승패를 변인으로 넣었어야 한다고 봅니다
제 개인적인 생각에 1:0승리나 2:0승리나 다 같은 승점3점이라고 해도 그 다음 경기를 준비할 수 있는 경기는 2점차 이상의 경기라고 생각하기에, 골은 많이 넣을 수록 중요하다고 봅니다