¿Por qué Dixon-Coles sigue siendo relevante frente a modelos de machine learning?

Los modelos de ML requieren grandes volúmenes de datos para superar a Dixon-Coles en fútbol. Con 380 partidos por temporada por liga, los datos son escasos. Dixon-Coles es interpretable, calibrable y generaliza bien con pocos datos. Los modelos de ML complejos tienden a sobreajustar en datasets pequeños y sus probabilidades no están calibradas por defecto.

¿Qué es el modelo Elo en fútbol y cómo difiere de Dixon-Coles?

El rating Elo asigna una puntuación a cada equipo que sube con victorias y baja con derrotas. Es simple y eficaz para ranking, pero solo produce una probabilidad de victoria — no genera distribuciones completas de marcadores ni probabilidades para mercados Over/Under o BTTS. Dixon-Coles modela goles explícitamente, lo que permite calcular todos esos mercados derivados.

¿Qué es el Pi-rating de Constantinou?

El Pi-rating es un sistema de rating publicado por Anthony Constantinou en 2012 que extiende el Elo considerando el margen de goles y la posesión. Es más preciso que Elo en ranking, pero como el Elo no genera distribuciones de marcadores completas. Se usa principalmente para ordenar equipos, no para calcular probabilidades de mercados específicos.

¿Existe algún modelo que supere consistentemente a Dixon-Coles?

El mercado de Pinnacle (cerrado, con márgenes del 1.5-2%) sigue siendo más preciso que cualquier modelo público, incluido Dixon-Coles. Entre los modelos no comerciales, las extensiones bayesianas de Dixon-Coles y los modelos de goles esperados (xG) que usan datos de eventos de partido consiguen mejoras marginales. Ningún modelo público bate de forma consistente a Pinnacle en Brier Score.

Modelos Matemáticos

Dixon-Coles vs otros modelos:
¿cuál predice mejor el fútbol?

Actualizado el 23 de mayo de 2026 · Por Marcelo Arancibia

Existen docenas de aproximaciones para predecir resultados de fútbol: desde sistemas de rating simples hasta redes neurales. Cada uno tiene supuestos distintos, necesidades de datos distintas y salidas distintas. Esta guía compara los enfoques principales y explica por qué Dixon-Coles sigue siendo el estándar en predicción cuantitativa.

El mapa de los modelos de predicción

Los modelos de predicción de fútbol se pueden clasificar en tres grandes familias según qué modelan y qué tipo de salida producen:

Sistemas de rating (Elo, Pi-rating)

Asignan una puntuación a cada equipo. Producen probabilidades de victoria pero no distribuciones de marcadores.

Modelos de conteo de goles (Dixon-Coles, Poisson doble)

Modelan los goles de cada equipo como distribuciones de Poisson. Producen matrices de marcadores completas.

Modelos de machine learning (XGBoost, redes neurales)

Aprenden patrones de datos crudos. Potencialmente más expresivos, pero requieren más datos y son opacos.

El modelo Elo en fútbol

El sistema Elo, originalmente diseñado para el ajedrez por Arpad Elo, fue adaptado al fútbol por varios investigadores. La idea es simple: cada equipo tiene un rating numérico. Cuando gana, su rating sube; cuando pierde, baja. La cantidad depende del rating del rival.

Lo que hace bien: es robusto, actualizable en tiempo real y produce rankings coherentes con el nivel real de los equipos a largo plazo. FiveThirtyEight usó un Elo adaptado para fútbol durante años con buenos resultados.

Lo que no puede hacer: el Elo solo produce P(local gana), P(empata), P(visitante gana). No puede calcular probabilidades de Over/Under 2.5, BTTS, marcador más probable ni ningún otro mercado derivado, porque no modela goles explícitamente. Además, asume que ganar 1-0 y ganar 4-0 aportan la misma información sobre el nivel del equipo.

El Pi-rating de Constantinou

Publicado por Anthony Constantinou en 2012, el Pi-rating extiende el Elo incorporando el margen de victoria y, en algunas versiones, la posesión del balón. Es más sensible que el Elo a la magnitud de los resultados: ganar 3-0 actualiza más el rating que ganar 1-0.

En benchmarks publicados, el Pi-rating supera al Elo en precisión de ranking y en predicción 1X2. Pero comparte su limitación fundamental: produce probabilidades de resultado, no distribuciones de goles. Para calcular mercados Over/Under o BTTS se necesita otro paso adicional que el Pi-rating no proporciona de forma nativa.

Machine learning: potencial y problemas

Los modelos de ML (XGBoost, random forests, redes neurales) pueden en principio capturar patrones complejos que un modelo paramétrico como Dixon-Coles no captura. Pero en fútbol enfrentan obstáculos importantes:

Datos escasos. Una liga tiene 380 partidos por temporada. Con 10 temporadas, son 3.800 observaciones — muy poco para entrenar modelos complejos sin sobreajuste.
Falta de calibración. Los modelos de ML producen puntuaciones, no probabilidades calibradas. Un modelo que dice "0.62" no garantiza que ese resultado ocurra el 62% de las veces. Se necesita calibración adicional.
Opacidad. Un modelo de 500 árboles no puede explicar por qué el Manchester City tiene 65% de ganar este partido específico. Dixon-Coles puede.
Cambios de distribución. Los equipos cambian de temporada en temporada. Un modelo entrenado en datos históricos puede no generalizar bien a plantillas completamente renovadas.

En la práctica, los mejores resultados con ML en fútbol se obtienen combinándolo con features derivadas de modelos estructurados — como los λ de Dixon-Coles o los xG históricos — más que usándolo como sustituto completo.

Tabla comparativa

Modelo	Prob. 1X2	Over/Under	Marcador	Calibrado	Interpretable
Elo	✓	✗	✗	Parcial	✓
Pi-rating	✓	✗	✗	Parcial	✓
Dixon-Coles	✓	✓	✓	✓	✓
ML (básico)	✓	✗	✗	✗	✗
ML + xG	✓	✓	Parcial	✗	✗

Por qué Dixon-Coles sigue siendo el estándar

Casi 30 años después de su publicación, Dixon-Coles sigue siendo el punto de partida de referencia en predicción cuantitativa de fútbol por varias razones:

Completo

Genera probabilidades para todos los mercados estándar a partir de un solo modelo entrenado.

Calibrado

Las probabilidades se pueden calibrar directamente. Cuando dice 60%, ocurre ~60% de las veces.

Interpretable

Los parámetros de ataque, defensa y ventaja local son directamente interpretables.

Eficiente en datos

Funciona bien con pocas temporadas de datos, lo que es crítico en fútbol.

La ventaja real de los modelos más complejos aparece cuando se dispone de datos de eventos de partido (disparos, xG por oportunidad, posición del campo…), no solo de resultados. Con datos de resultados únicamente, Dixon-Coles es difícil de superar de forma consistente.

El techo del modelo: el mercado de Pinnacle

El benchmark más honesto para cualquier modelo de predicción de fútbol es el mercado de Pinnacle, el bookmaker con los márgenes más bajos del mundo (1.5-2%). Sus cuotas cerradas son esencialmente el consenso del mercado eficiente.

En Brier Score, Pinnacle ronda 0.183. El modelo Dixon-Coles de POISSON FC ronda 0.200. Esa diferencia de ~0.017 puntos representa el techo que ningún modelo no comercial ha conseguido superar de forma consistente y reproducible en datos out-of-sample.

El objetivo de POISSON FC no es superar a Pinnacle — es ofrecerte una segunda opinión estadística independiente que, en casos específicos, puede identificar divergencias con el mercado donde existe edge real.

Ver el rendimiento real del modelo →

Explora el modelo en acción

Cada predicción de POISSON FC compara las probabilidades del modelo Dixon-Coles con las cuotas del mercado para identificar divergencias.

Ver predicciones de hoy El modelo Dixon-Coles →Qué es el Brier Score →

Recibe los 5 partidos con más edge cada semana

El modelo Dixon-Coles analiza 25 ligas y selecciona los partidos donde su probabilidad supera a la del mercado. Sin spam — solo datos, una vez por semana.

Value bets semanales, gratis

Los 5 partidos con mayor edge del modelo cada lunes. Sin spam.