El fútbol son los goles, es la única estadística que vale. Todo lo que hacemos, entrenamos o analizamos es con el objetivo de marcar más goles que el rival. Los jugadores, los cuerpos técnicos o los sistemas somos buenos o malos en función de las ocasiones de gol que se consiguen materializar. Y hay un indicador por excelencia para medir esto: xG (Expected Goals) para medir los Goles Esperados de tu equipo.
¿Qué son los “Goles Esperados” (xG)?
Los goles esperados, normalmente denominados xG o su término en inglés, Expected Goals, es un indicador estadístico que asigna una probabilidad de que una ocasión sea gol en función de las características de la jugada. No todas las ocasiones de gol tienen la misma probabilidad de acabar en la portería y dependen de muchos factores (distancia, ángulo, rivales por delante…). No es lo mismo un disparo escorado que centrado. Y no es lo mismo un tiro mano a mano contra el portero que un tiro con defensores por delante (aunque sea exactamente desde el mismo punto).
“El Expected Goal mide la calidad del tiro”
El indicador xG normalmente se mide en un rango del 0 al 1, donde 1 significa que esta ocasión tiene un 100% de probabilidad de ser gol (el máximo buscado por los equipos) y 0 que indica que tiene un 0% de probabilidades de acabar en la portería.
Los valores intermedios, por ejemplo 0,5 , dicen que hay un 50% posibilidades de que ese tiro acabe en gol (o lo que es lo mismo, 1 de cada 2 tiros con esas características deberían acabar en gol).
Según algunos modelos, una gran oportunidad tiene alrededor de un 38% (0,387) de ser gol, según datos de la Premier League en los últimos 5 años.
¿Pero para qué sirve esta métrica de “Goles Esperados”?
En el medio plazo, el xG responde a varias preguntas y ayuda a entender muchas cosas de lo que sucede en el campo.
Realizar análisis estadísticos solo basado en los goles puede llegar a ser engañoso. ¿Por qué? Porque en general en cada partido hay pocos goles, marcadores bajos, la muestra es escasa a lo largo de la temporada. Hablar de porcentajes cuando el volumen no es suficiente puede llevar a resultados engañosos. “He marcado en un 100% de mis corners. Pero claro, solo he lanzado 1”.
Opta Sport lo explica espectacular en este vídeo:
https://www.youtube.com/watch?time_continue=20&v=w7zPZsLGK18
Cuando acaba un partido, echas un vistazo a los tiros a puerta de cada equipo y todos hemos pensado alguna:
“¿Por qué tiramos tanto a puerta y no marcamos?”
“¿Por qué este equipo tira tan poco pero siempre marca?”
El equipo que genera más ocasiones no es siempre quien gana los partidos. Y los xG pueden responder a esas preguntas.
Una medición de los xG nos va a hablar de la calidad de nuestras oportunidades de gol, de las que se pueden sacar muchas conclusiones:
- El acierto de cara a portería. Si mis ocasiones de gol tienen un valor de 0,2, significa que debería meter 2 goles de cada 10 tiros a puerta. Si no lo hago, tengo un problema de finalización. Meto menos goles de los esperados.
- La calidad de tus ataques. Si consigo que mis ocasiones de gol tengan unos xG altos, significará que genero situaciones muy favorables para hacer gol. Es decir, el porcentaje de que cada tiro que hago sea gol es alto. Al contrario, si tiro mucho a puerta pero mi xG es bajo, podrá significar entre otras cosas que mis tiros no son tan claros (¿precipitación? ¿Incapacidad de generar situaciones mejores?..).
- La capacidad de conversión de un goleador. En sus ocasiones de gol, ¿está por encima o por debajo del xG? Los goleadores más valiosos meten más goles de lo que el xG espera para las ocasiones que disponen.
Si en un partido un equipo tira 15 tiros a puerta, con un xG medio de 0,05, y el rival tira 4, pero con un xG de 0,5, ¿quién está más cerca de ganar? Mirando solo las estadísticas tradicionales, el primero, que ha tirado 12 veces. Pero fijándonos en indicadores avanzados, el segundo está más cerca de marcar gol porque sus ocasiones tienen xG altos.
La estadística es una ciencia mundialmente reconocida como tal, usada día a día por empresas de todos los sectores, invirtiendo miles de euros para sacar conclusiones a sus datos. En el fútbol hay mucho escepticismo al respecto sobre su utilidad, pero lo que se tiene que poner en duda no es la estadística, sino la utilización indebida de los datos para indicar conclusiones que no son correctas. Un buen uso de tus datos, ayudado de estadística avanzada y técnicas de Big Data y Machine Learning, te ayudará a conocer mejor qué pasa con tu equipo y con su juego.
¿Qué factores influyen en el cálculo del Expected Goal?
Hay muchas variables que entran en juego a la hora de calcular la probabilidad de que un tiro a puerta sea gol. Las más sencillas pueden ser:
- Distancia a la portería (cuanto más cerca, más probable).
- Angulo respecto de la portería. (cuanto más centrado, más probable).
- Parte del cuerpo del golpeo (cabeza, pierna derecho…).
- Jugadores rivales delante de balón (medida de presión rival).
- Jugadores acompañando jugada.
- Cómo se creó la ocasión (contraataque, ABP, pase al pie, pase al espacio…)
Estos factores pueden ser los mas evidentes, pero en realidad podemos meter en el modelo otras variables no tan obvias que creamos que pueden tener relevancia en la ocasión:
- Marcador antes del gol. Si voy ganando, empatando o perdiendo puede tener influencia en la ansiedad del tiro.
- Clasificación del equipo.
- Clasificación del rival.
- Minuto en el que se hace el tiro.
- Posición del jugador (no remata igual un delantero que un central).
- Cómo recibe el balón el jugador que remata (de frente, de espaldas…)
- Distancia de jugador a portero.
- Distancia de jugador a defensa más cercano (que influirá en cómo de precipitado o molesto remato y cual puede ser la calidad de mi tiro).
- Local o visitante.
- Cómo se produce el tiro (tras regate, tras conducción, rebote de portero, etc).
- Velocidad vertical del ataque.
- Número de toques en la jugada.
- Posición del portero respecto de la portería.
“Teóricamente cualquier cosa que pueda afectar al resultado de un tiro debería pertenecer al modelo”
Todo lo creas que puede influir en que un tiro sea gol puede entrar en el modelo del goles esperados. Cuantas más variables introduzcas inicialmente en el modelo, más ajustado será el xG (aunque algunas de ellas sean descartadas posteriormente por el propio algoritmo utilizado). Y sobretodo, tendrás un contexto mayor para evaluar qué pasa en el juego de tu equipo.
¿Cómo se calculan los xG de cada tiro?
Una vez que he decidido cuales son las variables que creo que influyen en que un tiro sea gol (o cuales son las variables que tengo disponibles), llega el momento de calcular el Expected Goal (xG). Hay muchos enfoques para determinar los goles esperados. Es un indicador relativamente nuevo y no hay una manera común para calcularlo. Dependerá de cuantas variables significativas seamos capaces de meter en el análisis.
Usando una técnica matemática llamada regresión multivariable, podemos calcular que factores (variables) debemos usar y cual es el peso de cada una al resultado final. No os voy a mentir, no es algo sencillo, pero para nada es una técnica imposible e incluso con Excel se puede calcular.
Aplicamos un modelo de probabilidad y es la propia estadística la que nos va indicando si una u otra variable es o no relevante
No hay una formula mágica para calcularlo y tendremos que ir aplicando nuestros conocimientos estadísticos para entrenar, depurar y mejorar el modelo (hasta conseguir un R2 alto). No te agobies con esto. Los software de estadística hace casi todo el trabajo duro…
¿De donde saco los datos?
Para entrenar el modelo, necesitamos datos históricos con las características de los tiros y el resultado (ha sido gol o no).
Para conseguir los datos, depende de cual quieres que sea tu enfoque, hay opciones:
- Si eres amateur y quieres empezar a introducirte en la analítica y estadística deportiva, puedes utilizar datos más sencillos como los que facilita Whoscored. Ahí puedes sacar la información de tiros y goles por zonas (dentro del área pequeña, área grande y fuera de área). Si, es cierto, no son muchas variables pero te vale para experimentar y generar un modelo sencillo de Expected Goals.
- Si tu plan es más profesional o empresarial, quizás debas comprar los datos a Opta o probar con esta guía para encontrar datos de fútbol.
¿Y cuantos datos necesito? Cuantos más mejor. Para que un modelo estadístico sea fiable y robusto, necesita una muestra mínima necesaria.
Imaginemos que hay unos 20 tiros por partido, y en una temporada hay 380 partidos–> 20 x 380 = 7600 tiros para analizar. A partir de 5 temporada ya tendríamos un volumen bueno para comenzar (38000 tiros).
Un ejemplo de xG
En Inglaterra es algo que lleva años desarrollando y están un paso por delante de nosotros. Os dejo una visualización de la temporada 2015-16 en la Premier League hecha por Paul Riley:
Está diseñada con Tableau (que es una herramienta muy parecida a Power BI, de la que ya hemos hablado en Objetivo Analista).
¿Te convence el xG como medida del rendimiento?
El indicador xG dice mucho de cómo juega un equipo, de cómo son las ocasiones que genera/recibe y cómo es la tasa de conversión de cada jugador a la hora de rematar a puerta.
Entiendo y comparto que la estadística en el fútbol, de manera general, está siendo usada de forma banal. Pero eso no significa que esta ciencia, el Big Data o la tecnología aplicada al fútbol no sirvan. Lo que es necesario es una buena aplicación de las técnicas de cada caso.
En cualquier caso, cada vez más a menudo oirás hablar del Expected Goal, Goles Esperados o simplemente xG. A partir de ahora, estás listo para poder interpretarlo y aplicarlo a tus decisiones!