A todos nos gusta arriesgar eventos del futuro. Quién va a ganar las elecciones el año que viene, cuánto va a estar el dólar, si va a llover mañana, si van a venir los extraterrestres, si River va a salir campeón o si alguna vez Boca va a terminar su cancha. Quizás la vida sería más fácil si supiéramos todas esas cosas, aunque seguro mucho más aburrida. Los pronósticos sobre qué va a pasar no son solo una gran cuestión de entretenimiento, sino que hay también mucho dinero puesto en ellos. Y probablemente el mundial de fútbol es el evento que mejor combina esas dos cosas, lo que lo convierte en el escenario perfecto para hacer predicciones.
Los vaticinios sobre qué va a pasar abundan durante el mundial, con los prodes con amigos por un asado, las casas de apuestas deportivas con sus millones, los brujos visionarios que pegaron los últimos 3 mundiales pero justo en este se equivocan y el pulpo Paul, no nos olvidemos del pulpo Paul (si tenés menos de 20, googleá). A todo esto ahora se le suma la inteligencia artificial, ese monstruo hecho de silicio y millones de dólares que los boludos tratan como si fuera el oráculo de Delfos. "Quién va a ganar el mundial según la IA", "Cuantos goles va a meter Argentina según la IA", "Quién será el goleador según la IA" rezan los títulos de los diarios a sabiendas de que un título así genera muchos clics, el oro de nuestro tiempo.
Las IAs, o mejor dicho los grandes modelos de lenguaje que usamos masivamente en la actualidad (ChatGPT, Claude, Gemini, etc), no tienen la más remota idea de cómo va a salir un partido de fútbol. Es más, en su puta vida vieron un partido de fútbol y mucho menos patearon una pelota (ya que no tienen pies). Pero no nos enojemos con la IA: nadie sabe cómo va a salir un partido de fútbol, bah, en realidad nadie sabe nada acerca del futuro, pero menos que menos cómo va a salir un partido de fútbol, lo que es una de las cosas más lindas que tiene este deporte.
Sin embargo, lo que podemos hacer, tanto con el fútbol como con la vida, es pensar cómo hacer la mejor predicción que esté a nuestro alcance, y los matemáticos están en eso hace muchos años. Todas las grandes casas de apuestas, las financieras, los gobiernos, invierten grandes sumas de dinero en sofisticados modelos matemáticos que intentan anunciar qué va a pasar. En el fútbol en particular, los modelos matemáticos de predicción dieron un salto de calidad hace unos 30 años, con un trabajo realizado por Dixon y Coles, dos matemáticos ingleses que usaron datos del fútbol de la Premier League y otras ligas menores para adivinar el futuro.
En esto último hay algo clave, una pequeña muestra de por qué nunca vamos a poder conocer con certeza qué va a pasar en el futuro: la única herramienta que tenemos para hacerlo es mirar hacia el pasado y suponer que todo va a seguir funcionando más o menos igual. Y, mal que nos pese, sabemos que eso no siempre (o casi nunca) es cierto, que cada tanto hay un hecho que era imposible de pronosticar antes de que pase (aunque sea difícil admitirlo…con el diario del lunes somos todos Nostradamus).
El modelo que hicieron estos dos muchachitos funciona más o menos así: a partir del conocimiento que tenemos del pasado se le otorgan a cada equipo (o selección) dos números que van a representar su fuerza de ataque y su fuerza de defensa. Un equipo con un número alto de ataque será más probable que meta un gol que uno con un número más bajo y similar pasa con los goles en contra y el nivel de defensa. Una vez fijados esos números para cada equipo, se simula por computadora el torneo muchas veces (en general, más de un millón) y el equipo que ganó más veces en esas simulaciones será la predicción final.
Quizás, para algunos que no están acostumbrados, el término 'simulación por computadora' suene algo abstracto, pero la verdad es que la simulación podría realizarse en el mundo real. Por ejemplo, armando una cancha con máquinas que tiran bolitas, donde el equipo con mayor fuerza de ataque lanzará más rápido que el de menos y el de mayor fuerza de defensa tendrá un arco más chico que el de más. En la siguiente animación, se puede ver con un partido entre Argentina y Jordania:
Hay, sin embargo, dos cuestiones problemáticas con este modelo que quiero destacar. La primera es que la vida real no es tan sencilla: no estamos teniendo en cuenta un montón de factores que influyen en un resultado, como si un equipo es local, si se juega con hinchada o no, si el referí cobra mejor para un lado que para el otro, si llueve o no llueve, si el mejor jugador de un equipo juega o no, por nombrar algunas. Es decir, un partido de fútbol no se puede resumir otorgando dos números fijos para cada equipo: existen limitaciones intrínsecas del modelo, cosas que este no puede representar. Y acá está la trampa de la predicción: todo modelo que hagamos de la realidad va a ser limitado, porque existen un sinfín de variables que pueden afectar a un resultado y que nunca vamos a poder conocer, y es por eso que a pesar de los millones invertidos hoy en día seguimos sin saber qué va a pasar mañana.
Pero si nos olvidamos por un rato de esto y confiamos en nuestro modelo, existe otro problema: no tenemos ni idea de cuál es el número exacto de ataque y de defensa que tiene cada equipo, ni cual es la forma indicada de encontrarlo a partir de los datos. Por ejemplo, si quisiéramos estimar la fuerza de ataque para Argentina en este mundial, ¿tomamos los partidos del último año o del último mundial?. Fue hablado hasta el hartazgo que Argentina se enfrentó a rivales muy débiles en los amistosos que jugamos, ¿entonces conviene tomar los datos del último mundial? Pero ni Di María ni el huevo Acuña, ambos protagonistas de la final, están ahora, ¿es el mismo equipo Argentina como para estimarlo con ese mundial?. Y si tomaramos ambos, ¿deberíamos ponderar más los últimos partidos porque fueron hace menos o los del mundial pasado por la similaridad del contexto?
Hacer modelos de mundo es complicado y encontrar los parámetros correctos para definirlos más todavía. Nuestra realidad, nos guste o no, cuenta con un componente aleatorio que hace que la única certeza que tenemos sobre el futuro, es que no sabemos qué esperar de él.
Bonus track
Para jugar un rato, utilicé el modelo no para predecir quién va a ganar el mundial sino para estudiar qué equipo tuvo un sorteo más favorable en la fase de grupos y qué equipo tiene una llave más fácil a partir de dieciseisavos de final.
Como no quise complicarme mucho con la estimación de parámetros, no busqué datos de partidos pasados (eso queda para trabajos más serios como el que mostró en la página https://301060.exactas.uba.ar/ un equipo de la Facultad de Ciencias Exactas de la UBA) sino que directamente tomé el número del ranking FIFA del inicio del mundial, que es una estimación del nivel de cada país que da la federación. Tomando el ranking, armé de forma medio arbitraria el número de ataque y defensa de cada selección, suponiendo que una posición alta implicaría un buen número de ataque y de defensa. No es un gran modelo pero me sirve para ilustrar lo que busco.
Una vez estimada la fuerza de cada equipo, se me ocurrió lo siguiente. Como quiero evaluar la facilidad del contexto, y no predecir un ganador, decidí tomar 12 selecciones candidatas (Argentina, Uruguay, Brasil, Colombia, Ecuador, España, Alemania, Inglaterra, Francia, Bélgica, Países Bajos y Marruecos) y simular el mundial 50.000 veces poniendo siempre un rating "blanco" a cada una. Es decir, para saber si Argentina había tenido un sorteo fácil, le borraba los números estimados a partir de su ranking FIFA y le ponía un ranking promedio aunque factible que como para campeonar (el de una selección de un poco más que mitad de tabla, digamos), y simulaba 50.000 veces. Luego hacía lo propio con las demás. De esta manera, como cada vez que simulaba mirando a una selección, le ponía siempre el mismo ranking blanco, la selección que más veces haya ganado es la que tendría el sorteo más fácil. Los resultados fueron los siguientes.
| Selección | % campeona |
|---|---|
| Francia | 13,03 % |
| Inglaterra | 12,60 % |
| Bélgica | 12,51 % |
| Argentina | 12,29 % |
| España | 12,12 % |
| Brasil | 12,09 % |
| Selección | % campeona |
|---|---|
| Marruecos | 12,07 % |
| Colombia | 11,71 % |
| Alemania | 11,70 % |
| Uruguay | 11,55 % |
| Ecuador | 11,38 % |
| Países Bajos | 11,27 % |
Es decir, de las 50.000 corridas, Argentina ganó 12.294 veces, quedando cuarta entre las doce candidatas. Las diferencias en la fase de grupos fueron pequeñas —entre el 11,3% de Países Bajos y el 13,0% de Francia—, lo que indica que el sorteo inicial no le dio una ventaja decisiva a ningún equipo en particular. Luego, hice lo mismo, pero en vez de empezar desde la fase de grupos, empecé desde los dieciseisavos de final. Acá los resultados:
| Selección | % campeona |
|---|---|
| Argentina | 17,85 % |
| Colombia | 14,64 % |
| Inglaterra | 14,57 % |
| Francia | 13,35 % |
| Brasil | 12,32 % |
| España | 11,39 % |
| Selección | % campeona |
|---|---|
| Alemania | 11,04 % |
| Países Bajos | 10,76 % |
| Bélgica | 10,65 % |
| Marruecos | 10,54 % |
| Ecuador | 10,17 % |
Como vemos, Argentina, partiendo con un ranking blanco desde el cuadro que le quedó luego de la fase de grupos, ganó mucho más que las otras candidatas: saltó al primer puesto con 17,85%: casi 6 puntos más que en la anterior simulación. Colombia, que comparte parte del cuadro con Argentina, también subió mucho (de 11,71% a 14,64%), mientras que Bélgica, tercera en la anterior, cayó al noveno lugar, lo que indica que tendría una llave de las más complicadas. La última tabla muestra cuánto mejoró para cada selección las chances de ser campeona luego de la fase de grupos, con Argentina como claro puntero.
| Selección | % grupos | % dieciseisavos | Diferencia |
|---|---|---|---|
| Argentina | 12,29 % | 17,85 % | +5,56 % |
| Colombia | 11,71 % | 14,64 % | +2,93 % |
| Inglaterra | 12,60 % | 14,57 % | +1,97 % |
| Francia | 13,03 % | 13,35 % | +0,32 % |
| Brasil | 12,09 % | 12,32 % | +0,23 % |
| Países Bajos | 11,27 % | 10,76 % | −0,51 % |
| Alemania | 11,70 % | 11,04 % | −0,66 % |
| España | 12,12 % | 11,39 % | −0,73 % |
| Ecuador | 11,38 % | 10,17 % | −1,21 % |
| Marruecos | 12,07 % | 10,54 % | −1,53 % |
| Bélgica | 12,51 % | 10,65 % | −1,86 % |
Así las cosas. Tenemos buen cuadro y al mejor de todos. Pero calma: todavía queda mucho mundial, todos los rivales juegan y el futuro, como siempre, es incierto. Vamos Argentina.