Dixon-Coles vs otros modelos:
¿cuál predice mejor el fútbol?
Existen docenas de aproximaciones para predecir resultados de fútbol: desde sistemas de rating simples hasta redes neurales. Cada uno tiene supuestos distintos, necesidades de datos distintas y salidas distintas. Esta guía compara los enfoques principales y explica por qué Dixon-Coles sigue siendo el estándar en predicción cuantitativa.
El mapa de los modelos de predicción
Los modelos de predicción de fútbol se pueden clasificar en tres grandes familias según qué modelan y qué tipo de salida producen:
Sistemas de rating (Elo, Pi-rating)
Asignan una puntuación a cada equipo. Producen probabilidades de victoria pero no distribuciones de marcadores.
Modelos de conteo de goles (Dixon-Coles, Poisson doble)
Modelan los goles de cada equipo como distribuciones de Poisson. Producen matrices de marcadores completas.
Modelos de machine learning (XGBoost, redes neurales)
Aprenden patrones de datos crudos. Potencialmente más expresivos, pero requieren más datos y son opacos.
El modelo Elo en fútbol
El sistema Elo, originalmente diseñado para el ajedrez por Arpad Elo, fue adaptado al fútbol por varios investigadores. La idea es simple: cada equipo tiene un rating numérico. Cuando gana, su rating sube; cuando pierde, baja. La cantidad depende del rating del rival.
Lo que hace bien: es robusto, actualizable en tiempo real y produce rankings coherentes con el nivel real de los equipos a largo plazo. FiveThirtyEight usó un Elo adaptado para fútbol durante años con buenos resultados.
Lo que no puede hacer: el Elo solo produce P(local gana), P(empata), P(visitante gana). No puede calcular probabilidades de Over/Under 2.5, BTTS, marcador más probable ni ningún otro mercado derivado, porque no modela goles explícitamente. Además, asume que ganar 1-0 y ganar 4-0 aportan la misma información sobre el nivel del equipo.
El Pi-rating de Constantinou
Publicado por Anthony Constantinou en 2012, el Pi-rating extiende el Elo incorporando el margen de victoria y, en algunas versiones, la posesión del balón. Es más sensible que el Elo a la magnitud de los resultados: ganar 3-0 actualiza más el rating que ganar 1-0.
En benchmarks publicados, el Pi-rating supera al Elo en precisión de ranking y en predicción 1X2. Pero comparte su limitación fundamental: produce probabilidades de resultado, no distribuciones de goles. Para calcular mercados Over/Under o BTTS se necesita otro paso adicional que el Pi-rating no proporciona de forma nativa.
Machine learning: potencial y problemas
Los modelos de ML (XGBoost, random forests, redes neurales) pueden en principio capturar patrones complejos que un modelo paramétrico como Dixon-Coles no captura. Pero en fútbol enfrentan obstáculos importantes:
- Datos escasos. Una liga tiene 380 partidos por temporada. Con 10 temporadas, son 3.800 observaciones — muy poco para entrenar modelos complejos sin sobreajuste.
- Falta de calibración. Los modelos de ML producen puntuaciones, no probabilidades calibradas. Un modelo que dice "0.62" no garantiza que ese resultado ocurra el 62% de las veces. Se necesita calibración adicional.
- Opacidad. Un modelo de 500 árboles no puede explicar por qué el Manchester City tiene 65% de ganar este partido específico. Dixon-Coles puede.
- Cambios de distribución. Los equipos cambian de temporada en temporada. Un modelo entrenado en datos históricos puede no generalizar bien a plantillas completamente renovadas.
En la práctica, los mejores resultados con ML en fútbol se obtienen combinándolo con features derivadas de modelos estructurados — como los λ de Dixon-Coles o los xG históricos — más que usándolo como sustituto completo.
Tabla comparativa
| Modelo | Prob. 1X2 | Over/Under | Marcador | Calibrado | Interpretable |
|---|---|---|---|---|---|
| Elo | ✓ | ✗ | ✗ | Parcial | ✓ |
| Pi-rating | ✓ | ✗ | ✗ | Parcial | ✓ |
| Dixon-Coles | ✓ | ✓ | ✓ | ✓ | ✓ |
| ML (básico) | ✓ | ✗ | ✗ | ✗ | ✗ |
| ML + xG | ✓ | ✓ | Parcial | ✗ | ✗ |
Por qué Dixon-Coles sigue siendo el estándar
Casi 30 años después de su publicación, Dixon-Coles sigue siendo el punto de partida de referencia en predicción cuantitativa de fútbol por varias razones:
Completo
Genera probabilidades para todos los mercados estándar a partir de un solo modelo entrenado.
Calibrado
Las probabilidades se pueden calibrar directamente. Cuando dice 60%, ocurre ~60% de las veces.
Interpretable
Los parámetros de ataque, defensa y ventaja local son directamente interpretables.
Eficiente en datos
Funciona bien con pocas temporadas de datos, lo que es crítico en fútbol.
La ventaja real de los modelos más complejos aparece cuando se dispone de datos de eventos de partido (disparos, xG por oportunidad, posición del campo…), no solo de resultados. Con datos de resultados únicamente, Dixon-Coles es difícil de superar de forma consistente.
El techo del modelo: el mercado de Pinnacle
El benchmark más honesto para cualquier modelo de predicción de fútbol es el mercado de Pinnacle, el bookmaker con los márgenes más bajos del mundo (1.5-2%). Sus cuotas cerradas son esencialmente el consenso del mercado eficiente.
En Brier Score, Pinnacle ronda 0.183. El modelo Dixon-Coles de POISSON FC ronda 0.200. Esa diferencia de ~0.017 puntos representa el techo que ningún modelo no comercial ha conseguido superar de forma consistente y reproducible en datos out-of-sample.
El objetivo de POISSON FC no es superar a Pinnacle — es ofrecerte una segunda opinión estadística independiente que, en casos específicos, puede identificar divergencias con el mercado donde existe edge real.
Ver el rendimiento real del modelo →Explora el modelo en acción
Cada predicción de POISSON FC compara las probabilidades del modelo Dixon-Coles con las cuotas del mercado para identificar divergencias.