El supuesto de independencia
en fútbol y sus limitaciones
La distribución de Poisson aplicada al fútbol descansa sobre un supuesto simplificador: que los goles de cada equipo son estadísticamente independientes. Es una aproximación útil, pero imperfecta. Esta guía explica dónde falla y cómo Dixon-Coles lo corrige parcialmente.
Qué significa la independencia en probabilidad
Dos variables aleatorias X e Y son independientes si conocer el valor de X no proporciona ninguna información sobre Y. Formalmente, su probabilidad conjunta es el producto de sus probabilidades individuales:
P(X = x, Y = y) = P(X = x) · P(Y = y)
Solo válido si X e Y son independientes
Aplicado al fútbol: si los goles del equipo local (X) y del visitante (Y) son independientes, la probabilidad del marcador 2-1 es simplemente P(X=2) × P(Y=1), donde cada término se calcula con la distribución de Poisson del equipo correspondiente. Esto hace el cálculo computacionalmente sencillo y produce una tabla completa de marcadores con relativamente pocos parámetros.
Dónde el supuesto se rompe en fútbol
El supuesto de independencia asume que los goles ocurren de forma estática, como si el marcador del partido no existiera. Pero el fútbol es un juego dinámico donde el estado del marcador cambia el comportamiento de ambos equipos:
Efecto del marcador parcial
Cuando un equipo pierde 0-1 en el minuto 60, empieza a arriesgar más. El equipo ganador puede replicar con más espacio para el contraataque. El resultado: más goles de ambos equipos de los que el modelo estático predice. La Poisson independiente no captura este ciclo de retroalimentación.
Partidos de 0-0 más frecuentes de lo esperado
En partidos sin goles, ambos equipos tienden a mantener sus estructuras más conservadoras durante más tiempo. El modelo independiente subestima la probabilidad del 0-0 porque no captura esta dinámica defensiva de partidos sin incidentes.
El 1-1 y la 'estabilización'
Cuando el partido llega al 1-1, ambos equipos pueden optar por consolidar el resultado. Esto produce una ligera desaceleración en la probabilidad de más goles, generando correlación negativa en los goles tras el empate.
Tarjetas rojas
Una expulsión cambia radicalmente las probabilidades de goles de ambos equipos. El modelo de Poisson independiente no incluye este evento y, por tanto, cualquier partido donde ocurre una tarjeta roja tendrá predicciones menos precisas.
La evidencia empírica: marcadores que se desvían
Dixon y Coles (1997) cuantificaron las desviaciones comparando frecuencias observadas de marcadores con las predicciones del modelo de Poisson independiente. Los resultados más llamativos:
El patrón es consistente: los marcadores más bajos —donde la dependencia entre equipos es más pronunciada porque el partido aún no tiene un carácter definido— son los que más se alejan de las predicciones del modelo independiente.
La corrección τ(ρ) de Dixon-Coles
La solución de Dixon y Coles es introducir una corrección multiplicativa para los cuatro marcadores problemáticos. En lugar de usar directamente P(X=x) × P(Y=y), aplican:
P(X=x, Y=y) = τ(x, y, λ, μ, ρ) · P_Poisson(x; λ) · P_Poisson(y; μ)
Solo para (x,y) ∈ {(0,0), (1,0), (0,1), (1,1)}
El factor τ es una función de λ, μ (goles esperados de cada equipo) y ρ (parámetro de correlación estimado de los datos). Su valor puede ser mayor o menor que 1, lo que equivale a aumentar o disminuir la probabilidad de ese marcador respecto al modelo independiente.
Para los demás marcadores (2-0, 0-2, 2-1, 1-2, 2-2, etc.), la corrección no se aplica: el modelo usa la probabilidad de Poisson independiente directamente. La razón es práctica: la desviación estadística en esos marcadores no es suficientemente grande o consistente como para justificar el parámetro adicional.
Restricción de la corrección
La corrección solo garantiza que las probabilidades de los cuatro marcadores sumen correctamente con el resto. Si la magnitud de ρ es grande y los valores de λ y μ son extremos, τ puede producir probabilidades negativas — un caso límite que los modelos bien implementados evitan con restricciones sobre ρ durante la estimación.
Lo que la corrección no resuelve
La corrección τ es una mejora importante pero acotada. Existen fuentes de dependencia que el modelo de Dixon-Coles no intenta capturar:
- Efectos del estado del marcador en puntuaciones altas: cuando el partido va 3-0, la dinámica del juego cambia de forma significativa. El modelo trata ese estado igual que un 0-0.
- Tarjetas rojas: una expulsión en el minuto 30 convierte efectivamente el partido en otro deporte. Las probabilidades de goles cambian radicalmente — algo que el modelo estático no puede modelar sin información in-play.
- Motivación diferencial: un equipo ya campeón o ya descendido en la última jornada puede no maximizar su esfuerzo. El modelo no incluye variables de incentivo.
- Correlación entre temporadas: equipos que enfatizan ciertos estilos de juego (muy defensivos, muy ofensivos) pueden mostrar correlaciones sistemáticas más complejas que las que captura ρ.
Esto no invalida el modelo — las predicciones pre-partido son inevitablemente estáticas. Pero sí delimita el ámbito de validez de las probabilidades generadas. Son distribuciones de probabilidad sobre todos los posibles estados de juego, no sobre cada estado específico que podría ocurrir dentro del partido.
Otra limitación de Poisson: la overdispersión de los goles →Las probabilidades del modelo, en contexto
Las predicciones de POISSON FC incluyen la corrección τ para los marcadores bajos. Las probabilidades de resultado 1X2, Over/Under y BTTS integran esa corrección en todos los cálculos.