Qué estadísticas de fútbol predicen mejor los resultados
No todas las estadísticas de fútbol tienen el mismo poder para anticipar resultados futuros. Algunas correlacionan fuertemente con el rendimiento siguiente; otras son ruido con apariencia de señal. La diferencia entre ambas no siempre es intuitiva.
El problema de las estadísticas descriptivas vs predictivas
Una estadística puede describir perfectamente lo que ocurrió en un partido y aun así no predecir nada sobre el siguiente. La pregunta relevante no es "¿qué captura esta métrica?" sino "¿qué correlaciona esta métrica con el rendimiento futuro?"
La distinción importa porque el análisis de fútbol convencional mezcla ambos tipos sin distinguirlos. Un comentarista puede citar la posesión para explicar un resultado — y tener razón sobre el partido pasado — mientras que esa misma métrica anticipa poco sobre el partido siguiente.
Tabla de poder predictivo por métrica
La siguiente tabla resume la correlación aproximada de cada métrica con resultados futuros, estimada a partir de estudios sobre grandes ligas europeas con muestras de múltiples temporadas:
| Métrica | Correlación con rendimiento futuro | Nota |
|---|---|---|
| xG diferencial (temporada) | Alta ~0.60 | La señal más estable |
| Tiros a puerta diferencial | Media-alta ~0.50 | Proxy razonable de xG |
| xG diferencial (últimos 8 partidos) | Media ~0.40 | Ventana útil con decay |
| Goles marcados (temporada) | Media ~0.38 | Más ruido que xG |
| Forma reciente (últimos 5) | Baja-media ~0.30 | Parte es nivel base, no racha |
| Posesión media | Baja ~0.25 | Estilo, no calidad |
| % pases completados | Baja ~0.20 | Correlaciona con posesión |
| Racha victorias/derrotas | Muy baja ~0.15 | Alta varianza situacional |
Correlaciones aproximadas sobre datos históricos de Premier League, Bundesliga y La Liga. Los valores exactos varían por liga, temporada y definición de xG utilizada.
Por qué el xG diferencial lidera
El xG (goles esperados) asigna a cada disparo una probabilidad de gol según la posición, el tipo de acción y la presión defensiva. Al sumar todos los disparos del partido, el xG total filtra la varianza del disparo individual — el factor suerte de si entró o no.
La diferencia entre el xG a favor y el xG en contra (xG diferencial) captura la dominancia real del partido: quién creó más peligro y quién lo concedió. Esta señal es más estable entre partidos que los goles reales porque no depende de la puntería de un día concreto.
Ejemplo: Un equipo pierde 1-0 pero genera 2.1 xG y concede 0.4 xG. Los goles dicen "derrota merecida". El xG diferencial dice "dominó el partido y tuvo mala suerte". El modelo pesa el xG diferencial más que el resultado para estimar el nivel real del equipo.
Por qué la posesión tiene poco poder predictivo
La posesión describe el estilo de juego de un equipo, no su capacidad para superar al rival. Un equipo puede controlar el balón sin crear peligro real — y otro puede defender con bloque bajo y ganar sistemáticamente con el 35% de posesión mediante transiciones rápidas.
La correlación entre posesión y resultados futuros es baja porque mezcla señal y ruido: los equipos que dominan el balón y generan xG alto predicen bien. Los que dominan el balón pero generan poco xG no predicen nada útil. La posesión sola no distingue entre ambos casos.
La forma reciente: útil pero sobrevalorada
Cinco victorias seguidas generan narrativa de "equipo intratable". Estadísticamente, esa racha tiene dos componentes:
- Nivel base del equipo: la mayoría de las victorias en racha las gana un equipo que ya era objetivamente mejor que sus rivales de esa secuencia.
- Varianza real: una pequeña fracción es suerte acumulada — resultados a favor en momentos donde el xG era equilibrado.
El modelo usa decay temporal para ponderar partidos recientes con más peso, capturando el componente real de forma sin sobreponderar la varianza situacional de rachas cortas. Una racha de 5 partidos aporta señal, pero no tanto como sugiere el análisis cualitativo habitual.
Qué combinación de métricas usa el modelo
POISSON FC no usa directamente el xG de los partidos anteriores como entrada. En cambio, estima los parámetros de ataque (λ) y defensa (μ) de cada equipo mediante regresión de Poisson sobre el historial de goles marcados y concedidos, con decay temporal que ponderara más los partidos recientes.
El resultado es funcionalmente similar a usar el xG diferencial acumulado con decay: captura el nivel real del equipo filtrando la varianza de partido individual, sin depender de la disponibilidad de datos xG para todas las ligas y temporadas.
Cómo funciona la distribución de Poisson en el modelo →Ver las métricas del modelo en acción
Las predicciones de POISSON FC muestran las probabilidades calculadas a partir de los parámetros de ataque y defensa de cada equipo. El simulador permite ajustar λ y μ manualmente para ver cómo cambian las probabilidades de cada resultado.