Evaluación de Modelos

Los errores estadísticos más comunes al analizar fútbol

El análisis de fútbol con datos es mejor que el análisis intuitivo, pero no es inmune a errores de razonamiento. Seis errores estadísticos aparecen una y otra vez en el análisis deportivo y distorsionan las conclusiones incluso cuando los datos son correctos.

Error 1: Muestra demasiado pequeña

El fútbol tiene baja frecuencia de eventos. Un partido produce típicamente 2-3 goles, y una temporada regular solo 38 jornadas. Con pocos partidos, las estadísticas de un equipo tienen un intervalo de confianza muy amplio — es decir, son compatibles con un rango muy amplio de niveles reales.

Señal de alerta: sacar conclusiones sobre el nivel de un equipo con menos de 8 partidos, especialmente al inicio de temporada o tras un cambio de entrenador. Las primeras 5-6 jornadas son estadísticamente ruidosas incluso si los resultados parecen claros.

Error 2: Sesgo de recencia

Los últimos 2-3 resultados reciben un peso cognitivo desproporcionado. Un equipo sólido que pierde dos partidos seguidos no ha "entrado en crisis" estadísticamente — puede ser varianza normal. Un equipo mediocre que gana tres seguidos no se ha "transformado".

El sesgo de recencia lleva a sobreajustar las estimaciones hacia resultados recientes que tienen alta varianza. La solución no es ignorar los partidos recientes — el decay temporal existe por algo — sino ponderar correctamente cuánto peso merecen frente al historial completo.

Señal de alerta: cambiar drásticamente la estimación de un equipo basándose en los últimos 2-3 partidos sin que exista un evento estructural (lesión clave, cambio de entrenador, variación de esquema).

Error 3: Confundir correlación con causalidad

El error más clásico: "el equipo ganó porque tuvo más posesión", "perdió porque remató menos". En ambos casos se invierte la flecha causal. El equipo puede haber tenido más posesión porque iba ganando y el rival presionó menos. Los goles cambian el comportamiento de ambos equipos y distorsionan muchas estadísticas del partido.

  • Posesión tardía: un equipo que defiende una ventaja cede posesión voluntariamente. La posesión no causó el resultado — lo refleja.
  • Tiros tras marcador: el equipo que pierde por 2-0 genera más tiros en la segunda parte porque el rival no defiende. El xG generado no refleja el nivel real de amenaza en un contexto neutro.

Error 4: Ignorar la tasa base

La tasa base es la frecuencia histórica de un evento en condiciones generales. En fútbol, las tasas base de resultados son:

Victoria local

~45–47%

Depende de la liga

Empate

~25–27%

Relativamente estable entre ligas top

Victoria visitante

~27–29%

Ha aumentado en la última década

Cualquier análisis que asigne a un resultado una probabilidad muy diferente a su tasa base necesita evidencia sólida que justifique la desviación. Sin esa evidencia, la tasa base es el prior correcto.

Señal de alerta: apostar al empate a cuota 2.90 implica asumir ~34% de probabilidad implícita — significativamente superior a la tasa base de ~26%. Sin un motivo estadístico específico para ese partido, esa desviación no tiene fundamento.

Error 5: Sobreinterpretar el xG de un partido

El xG de un partido individual tiene alta varianza. La creación de ocasiones fluctúa notablemente entre partidos del mismo equipo sin que su nivel real haya cambiado. Un partido con 2.5 xG generado seguido de uno con 0.8 xG es compatible con un equipo que produce consistentemente ~1.5 xG por partido.

La señal del xG emerge al acumular varios partidos. Con menos de 5-6 partidos, el xG de un partido específico es descriptivo — explica ese partido — pero no es predictor fiable del siguiente.

Cómo leer correctamente el xG de un partido →

Error 6: Comparar estadísticas fuera de contexto

Un xG de 1.8 por partido en la Bundesliga no equivale a 1.8 en la Serie A. Los ritmos de juego, la densidad defensiva media y los estilos tácticos de cada liga producen distribuciones distintas de xG. Un equipo que genera 1.8 xG en la Serie A puede ser excepcional en ataque; el mismo número en la Bundesliga puede ser exactamente la media.

El mismo problema aplica al comparar equipos de distintos contextos dentro de la misma liga: el xG generado contra los cinco equipos más débiles no es comparable al xG contra los cinco más fuertes. La fortaleza del rival siempre debe contextualizarse.

Profundizar en el análisis estadístico

Evitar estos errores es parte del proceso de leer correctamente las probabilidades del modelo. La calibración del modelo y el análisis de qué estadísticas predicen mejor son el siguiente paso natural.

⚠ Las predicciones son estimaciones estadísticas, no consejo de apuestas ni garantía de resultados. Solo mayores de 18 años. Términos · Acerca