Clear Sky Science · es

Predicción mejorada de partidos de críquet mediante métodos kernel para extracción de características y redes neuronales de retropropagación

· Volver al índice

Predicciones más inteligentes para aficionados al críquet

Los aficionados al críquet conocen la emoción de intentar adivinar quién ganará mientras un partido oscila de un lado a otro. Este estudio convierte esa intuición en números usando herramientas modernas de datos para pronosticar el resultado de partidos internacionales de un día (ODI) bola a bola. En lugar de esperar hasta el final, el sistema actualiza su predicción después de cada over, ofreciendo una estimación continua de las probabilidades de cada equipo a medida que se desarrolla el juego.

Leer el partido como un experto en datos

En el corazón del trabajo hay una idea simple: cada over representa una instantánea del partido. Los autores tratan cada una de estas instantáneas como un estado de juego separado y se preguntan: “Dado lo que sabemos ahora, ¿qué probabilidad tiene el Equipo B de ganar?” Para responder, introducen seis tipos de información en un sistema de predicción: cuántas bolas quedan, por cuántas carreras va por delante el Equipo A, cuántas wickets permanecen, cuán fuerte es cada equipo en general, si la afición local favorece a un bando y quién ganó el saque. Al mezclar estos elementos, el sistema captura tanto la presión del marcador como el contexto más amplio del que hablan los comentaristas humanos.

Figure 1
Figura 1.

Construir puntuaciones de fortaleza a partir de un siglo de partidos

El modelo se entrena con una vasta colección de datos internacionales de críquet que se remontan a 1877 e incluyen formatos ODI, Test y T20. Para cada jugador, los investigadores recopilan registros de bateo, lanzamiento y fildeo, como promedios, tasas de strike y tasas de economía. Estos se combinan en una puntuación de “fortaleza del equipo” que refleja cuánto vale un conjunto sobre el papel antes de que se lance una bola. Durante el partido, esta fortaleza a largo plazo se mezcla con condiciones a corto plazo como la ventaja de jugar en casa y la situación actual de la persecución, produciendo alrededor de 100.000 registros de estado de partido cuidadosamente limpiados para que el sistema de aprendizaje los estudie.

Dejar que los algoritmos elijan las pistas más reveladoras

No todas las estadísticas ayudan al ordenador a tomar una mejor decisión, y incluir demasiadas puede confundirlo. Para abordar esto, los autores usan un método de búsqueda inspirado en ligas deportivas, llamado Algoritmo del Campeonato de Liga (League Championship Algorithm). En este enfoque, muchos subconjuntos diferentes de características “compiten” entre sí. Los subconjuntos que conducen a mejores predicciones se tratan como equipos ganadores, y los más débiles copian partes de su estrategia. Tras muchas rondas, este proceso converge en un pequeño conjunto de entradas especialmente útiles. Las pruebas muestran que este método de selección supera a técnicas más comunes, logrando mayor precisión y un modelo más simple y eficiente.

Cómo la red neuronal aprende a señalar un ganador

Una vez elegidas las mejores características, se envían a una red neuronal de retropropagación, una herramienta flexible de reconocimiento de patrones que ajusta pesos internos hasta poder enlazar con fiabilidad estados de partido con resultados. Cada over se convierte en un ejemplo de entrenamiento: la entrada son los seis criterios clave y la salida es si el Equipo B terminó ganando o perdiendo. Al comparar repetidamente sus predicciones con los resultados reales y ajustando sus parámetros internos para reducir errores, la red aprende gradualmente combinaciones sutiles de condiciones —como un equipo perseguidor fuerte con wickets en mano y ventaja de localía— que suelen conducir a la victoria.

Figure 2
Figura 2.

Superando a modelos rivales a través de formatos

Los autores enfrentan su red a varios enfoques rivales, incluidos modelos basados en características seleccionadas manualmente y métodos basados en árboles ampliamente usados en analítica deportiva. En datos de ODI, Test y T20, su sistema ofrece mayor precisión, con puntuaciones en el conjunto de prueba alrededor de la mitad del 80 por ciento, y mejor rendimiento en medidas que capturan tanto con qué frecuencia detecta un probable ganador como con qué frecuencia esas predicciones positivas son correctas. Los factores más influyentes resultan ser estadísticas relacionadas con la anotación, como la tasa de strike y las carreras totales, lo que coincide con la intuición del aficionado de que bateadores rápidos y consistentes pueden inclinar partidos reñidos.

Qué significa para aficionados, equipos y emisoras

Para un lector general, la conclusión es que el flujo y reflujo de un partido de críquet puede ahora traducirse en probabilidades de victoria precisas y actualizadas regularmente. Al mezclar registros de jugadores a largo plazo, condiciones inmediatas de partido y un sistema de aprendizaje cuidadosamente afinado, el estudio muestra que podemos pronosticar resultados con notable fiabilidad mientras el juego aún está en curso. Estas herramientas podrían apoyar la narración en directo, decisiones de entrenamiento e incluso aplicaciones para espectadores que muestren cómo cada bola modifica las probabilidades. En términos sencillos, la investigación demuestra que cuando las ricas estadísticas del críquet se combinan con algoritmos inteligentes, nuestro sentido intuitivo de “quién domina” puede convertirse en una imagen clara y basada en datos.

Cita: Dhinakaran, K., Anbuchelian, S. Enhanced cricket match prediction using kernel methods for feature extraction and back-propagation neural networks. Sci Rep 16, 6478 (2026). https://doi.org/10.1038/s41598-026-36555-6

Palabras clave: analítica de críquet, predicción deportiva, aprendizaje automático, redes neuronales, pronóstico de partidos