La distribución de Poisson
en fútbol
El nombre de este sitio no es casual. La distribución de Poisson es la herramienta matemática central para calcular probabilidades de goles y marcadores en fútbol. Esta guía explica cómo funciona y por qué es una aproximación tan útil.
Por qué los goles siguen una distribución de Poisson
Los goles en un partido de fútbol comparten tres características que los hacen compatibles con la distribución de Poisson:
- Son eventos discretos y raros. En 90 minutos, un equipo típico marca 1-2 goles. Los eventos raros se modelan bien con Poisson.
- Ocurren a una tasa media estable. Dado el nivel de los equipos, existe una tasa esperada (λ) que el modelo puede estimar.
- Son aproximadamente independientes. El gol del minuto 20 no cambia la probabilidad de que haya otro gol en el minuto 60 — al menos en primera aproximación.
Esta aproximación no es perfecta (los goles de ambos equipos tienen cierta correlación), pero es suficientemente buena para generar probabilidades útiles. El modelo Dixon-Coles añade una corrección para los casos más problemáticos.
La fórmula de Poisson
La distribución de Poisson da la probabilidad de observar exactamente k eventos cuando la tasa media esperada es λ:
P(k ; λ) = e−λ × λk / k!
k = número de goles (0, 1, 2, 3…)
λ = goles esperados del equipo (expected goals)
e = 2.71828… (base del logaritmo natural)
k! = factorial de k (0!=1, 1!=1, 2!=2, 3!=6…)
Esta fórmula produce una distribución completa de probabilidades para cada número posible de goles. La suma de todas las probabilidades es siempre el 100%.
Tabla de probabilidades con λ = 1.5
Con 1.5 goles esperados — una tasa típica para un equipo de nivel medio — la distribución queda así:
| Goles (k) | P(k ; 1.5) | Acumulado |
|---|---|---|
| 0 goles | 22.3% | 22.3% |
| 1 goles | 33.5% | 55.8% |
| 2 goles | 25.1% | 80.9% |
| 3 goles | 12.6% | 93.5% |
| 4 goles | 4.7% | 98.2% |
| 5 goles | 1.4% | 99.6% |
El resultado más probable es 1 gol (33.5%), pero la probabilidad de 0 goles (22.3%) es muy significativa. Esto explica por qué los resultados con pocos goles — 0-0, 1-0, 0-1 — son tan frecuentes en fútbol.
Cómo se calcula la probabilidad de un marcador
Si asumimos independencia entre los goles de cada equipo, la probabilidad de un marcador específico X-Y es el producto de dos distribuciones de Poisson:
Ejemplo — Arsenal (λ=1.8) vs Chelsea (λ=1.1)
Repitiendo este proceso para todos los posibles marcadores (0-0, 0-1, 1-0, 1-1… hasta, por ejemplo, 6-6), se construye una tabla completa de probabilidades. Sumando los marcadores donde gana el local, se obtiene P(victoria local). Sumando los empates, P(empate). Y así para los demás mercados.
Cómo se calcula el marcador más probable →Qué es λ y de dónde viene
Lambda (λ) es el parámetro central de la distribución: los goles esperados de cada equipo. No es un número fijo — el modelo lo calcula partido a partido combinando:
Para el equipo local
λ_local = ataque_local × defensa_visitante × ventaja_local × μ_liga
Para el equipo visitante
λ_visitante = ataque_visitante × defensa_local × μ_liga
Los parámetros de ataque y defensa se estiman a partir del historial de resultados de cada equipo, ponderando los partidos recientes con más peso que los antiguos (el parámetro de decay ξ controla esto). μ_liga es la tasa media de goles de la competición, que ancla los cálculos.
Cómo Dixon-Coles estima estos parámetros →La limitación principal: correlación entre equipos
El supuesto de independencia no es del todo correcto. En partidos muy desequilibrados, el equipo que pierde tiende a abrir líneas para buscar el gol, lo que aumenta los goles del rival. Esto genera una correlación negativa entre los goles de ambos equipos que la Poisson pura no captura.
La consecuencia más visible: la Poisson pura sobreestima ligeramente la probabilidad de marcadores como 1-1 y 2-2, y subestima la de 0-0 y resultados muy asimétricos. Dixon y Coles identificaron este problema en 1997 e introdujeron el parámetro ρ para corregirlo en los marcadores bajos (0-0, 1-0, 0-1, 1-1).
Nota técnica
La corrección de Dixon-Coles solo afecta a los cuatro marcadores más bajos. Para marcadores con 2+ goles por equipo, la Poisson independiente es suficientemente precisa. El parámetro ρ se estima junto con el resto del modelo por máxima verosimilitud.
Ver las probabilidades del modelo en acción
Cada predicción de POISSON FC incluye las probabilidades 1X2, Over/Under y BTTS calculadas con la distribución de Poisson sobre los λ estimados partido a partido.