En primer lugar, como la mayoría no me conoceréis, me gustaría presentarme, soy Daniel R. Antequera. Estudié el grado de Ciencias Físicas en la Universidad Complutense de Madrid, después obtuve el Máster en Big Data Deportivo por la UCAM en el que pude hacer prácticas como analista de datos en el Real Sporting de Gijón. También me formé como analista en el curso Analista 360º que imparte Dani y actualmente soy el analista tanto del AC Intersoccer Madrid como del CD Paracuellos, ambos pertenecientes a la 1ª División Regional de Madrid.
Hace unos meses empecé a trabajar en el grupo de investigación de Redes Biológicas del Centro de Tecnología Biomédica (CTB) con Javier M. Buldú y David Garrido para estudiar la aplicación de la Ciencia de las Redes al fútbol. Y os preguntaréis: “¿Qué es eso de la Ciencia de las Redes y qué tiene que ver con el fútbol?”. Bien, en este artículo vamos a ver qué es una red compleja, cómo analizarla y qué relación tiene con el deporte que más nos gusta. ¡Acompáñame!
Redes de jugadores
Cuando aplicamos la Ciencia de las Redes al fútbol, entendemos una red como una serie de nodos (jugadores) conectados por algún tipo de relación o ‘enlace’ (que en el caso del fútbol podrían ser, entre otros, los pases entre jugadores). Estos enlaces, comúnmente llamados links, tienen dirección puesto que no es lo mismo un pase de Kroos a Modric que de Modric a Kroos (Figura 1A). Además podemos asignar al link un peso en función de la cantidad de pases que se hayan producido.
Con todas estas premisas y dotando a los nodos de una posición (en general la posición media desde donde salieron sus pases) podemos construir redes como la de la Figura 1B.
Si hasta aquí te ha resultado interesante, sigue leyendo porque lo bueno comienza ahora. Como sabrás, la mayoría de los análisis se suelen centrar en eventos relacionados con el gol y/o en jugadores aislados. Como ejemplos tenemos el caso de los goles esperados (Figura 2A) o la comparación de jugadores en gráficos de radar (Figura 2B).
Pero coincidiremos en que el fútbol es un deporte muy complejo, donde infinidad de factores influyen en el rendimiento de un equipo, por tanto, cuanta más información se tenga tanto de los jugadores como del equipo en su conjunto, más fundamentadas estarán las decisiones del cuerpo técnico. No debemos olvidar que el juego de un equipo depende de la interacción de once jugadores y no se puede cuantificar totalmente analizando solamente a los jugadores por separado.
Aquí es donde la Ciencia de las Redes aplicada al fútbol llega en nuestra ayuda. Esta área científica explica la relación que existe entre jugadores por medio de estos vínculos que hemos llamado links, permitiendo descifrar cuáles son los patrones que aparecen en dichas redes de jugadores.
Por ejemplo, podemos determinar qué jugador es el más relevante de la red, cómo de conectados están los distintos jugadores entre sí, cuál es el número mínimo de jugadores por los que tiene que pasar el balón para ir de un lugar a otro y un largo etcétera de indicadores.
Ejemplo de estudio
Te voy a mostrar un ejemplo de un trabajo que tuvimos la suerte de publicar recientemente en Marca.
El estudio se centró primero en tener bien definido al Barcelona de Guardiola de la temporada 2009/2010 desde el punto de vista de la Ciencia de las Redes aplicado al fútbol. El equipo de Pep es uno de nuestros referentes ya que colaboramos habitualmente con Paco Seirul.lo, preparador físico del primer equipo en la época de Johan Cruyff y del propio Pep Guardiola, y actualmente en el Departamento de Metodología del Fútbol Club Barcelona. Entre los parámetros que se tuvieron en cuenta destacan:
- Dispersión de los jugadores en el terreno de juego.
- La posición media de los pases.
- La eficiencia global en la distribución de pases.
- El número de jugadores por los que debe pasar el balón para ir de un jugador a cualquier otro (este parámetro se conoce como “shortest-path”).
- La cantidad de triángulos que tiene la red (coeficiente de clustering).
- Robustez de la red ante la eliminación de una conexión (máximo autovalor).
Después de esto se procedió a la comparación con los rivales en partido directo y como era de esperar las diferencias con todos ellos eran bastante grandes y no sólo eso, todas las diferencias eran favorables al equipo de Guardiola desde el punto de vista de redes. Cabe apuntar que el shortest-path se valora positivamente cuanto menor sea su valor, puesto que mejor conectada estará la red.
Para completar todo esto se hicieron los mismos cálculos con el Barcelona de Valverde para comparar ambos equipos entre sí y sus rivales. Si quieres conocer el resultado final lo puedes encontrar en el artículo completo.
Además, esto no se queda aquí, se puede profundizar mucho más en el análisis extrayendo lecturas del propio grafo como: la amplitud, la profundidad, jugadores entre los que es mayor la triangulación, incluyendo variables como el tiempo, simular cómo afecta a la red una sustitución, una expulsión, qué ocurre antes y después de un gol. Incluso se puede estudiar la red en base a si jugamos de local o visitante, en función del marcador o si varía entre la primera y la segunda parte. Como ves, si entras en el juego de las redes puedes ampliar tus análisis de una forma bastante considerable.
Redes de campo
Todavía no te lo he contado todo, también existen las redes de campo (Figura 5). Por un momento nos vamos a olvidar de los jugadores y vamos a dividir el campo en porciones iguales. Esto se puede hacer de muchas maneras: porciones más grandes, más pequeñas, más anchas que largas, al revés, más porciones en una dirección que otra o las mismas. Tenemos muchas posibilidades. En función de las dimensiones que escojamos obtenemos diferentes propiedades de la red.
En este tipo de redes los nodos son las propias regiones del campo y se pueden dar links entre la misma zona, que se representa con enlaces que salen y entran en el mismo nodo.
La aplicación más sencilla que a todos se nos ocurre es la más visual. Con este tipo de análisis obtenemos de una forma rápida qué zonas son las más ocupadas por cada equipo con balón, lugares de mayor asociación y por qué caminos se busca más verticalidad para llegar a portería contraria creando así más peligro. Estas figuras las podemos representar con todos los matices que hemos comentado antes para las redes de jugadores (marcador, local/visitante, 1ª/2ª parte…).
Las redes de campo tienen la particularidad de que podemos hacer análisis multiescala en función de las particiones que hagamos sobre el campo y de esta manera podemos extraer distintas propiedades para cada división.
Sabiendo esto y que las redes se representan matemáticamente como matrices (sí, aquello que aprendiste en bachillerato resulta que sirve para algo más que para hacerte sufrir en selectividad), se pueden correlacionar para cada partición y así obtener información numérica de lo similar que es el juego de un equipo a lo largo de los partidos.
Cuando las matrices de un mismo equipo a lo largo de una temporada tienen una correlación alta se dice que el equipo es consistente y si además es diferente del resto de equipos podemos decir que el equipo es identificable.
El concepto de identificabilidad es útil a la hora de plantear un partido dado que podemos saber si un equipo mantiene su forma de jugar tanto de local como de visitante, contra equipos grandes y pequeños etc., o si por el contrario no es así.
Calculando la identificabilidad para todos los partidos de la temporada 18/19 se puede obtener lo que veis en al Figura 7. En el eje vertical tenemos los equipos que jugaban como local y además ordenados según la clasificación final. En el eje horizontal, lo mismo pero jugando de visitante. Se marcan en color amarillo los partidos en los que el equipo local logró imponer su estilo, en azul cuando no hay una decisión clara y en verde cuando fue el visitante quien fue más identificable.
Se puede apreciar como el marcador puede no ser influyente a la hora de discernir quién impuso su estilo, habiendo resultados amplios sin una decisión clara e incluso darse el caso de imponer el estilo quien finalmente resultó derrotado. También se puede observar como en el triángulo superior abunda más el amarillo y en el inferior el verde. Es decir, en general los equipos que terminaron más arriba en la clasificación fueron capaces de imponer su estilo en más ocasiones que el resto. Excepciones particularmente reseñables son el Betis de Setién y el Eibar de Mendilibar, que lograron imponer en bastantes ocasiones su estilo para su clasificación final.
Este, entre otros resultados, fue presentado (Figura 8) por el investigador principal del grupo, Javier M. Buldú, en el congreso que organizó Opta en Londres en febrero de 2020 (OptaPro Forum) como recogió en un artículo LaLiga.
Esto son solo algunas pinceladas, amigos. Espero haberos convencido de lo útil que puede ser contar con el análisis de la ciencia de las redes aplicada al mundo del fútbol y estamos seguros de que con los datos de tracking estos estudios se verán enriquecidos.
Pero no queda aquí la cosa, en nuestro grupo de investigación seguimos trabajando en nuevas formas de analizar el fútbol, no sólo con redes, también con otros puntos de vista para entender y descifrar mejor el juego.