Clear Sky Science · es
Predicción multidisciplinar de lesiones relacionadas con la carrera mediante aprendizaje automático
Por qué importa a los corredores
Correr de resistencia es una de las formas más populares de mantenerse en forma, pero casi la mitad de los corredores habituales sufre una lesión significativa cada año. Estos problemas pueden descarrilar el entrenamiento, afectar la calidad de vida y generar gastos médicos. Este estudio plantea una pregunta práctica con herramientas de vanguardia: ¿podemos combinar información sobre el cuerpo, el estilo de vida y el entrenamiento de un corredor en un modelo informático que alerte cuando se aproxima una lesión, antes de que ocurra?

Mirando al corredor en su conjunto, no solo a las zapatillas
La mayoría de estudios previos trataron de vincular las lesiones al correr con una sola variable a la vez —como el volumen de entrenamiento, el tipo de calzado o una medida de fuerza aislada—. Pero las lesiones en el mundo real suelen surgir de una maraña de influencias: genética, lesiones previas, fuerza muscular, patrones de movimiento, constitución corporal, dieta y cómo cambian las cargas de entrenamiento con el tiempo. En este trabajo, los investigadores reunieron un retrato poco común y muy detallado de 142 corredores de resistencia competitivos, de entre 14 y 50 años, seguidos durante un año completo. Para cada corredor recogieron medidas de laboratorio de hueso y músculo, análisis de movimiento del estilo de carrera, pruebas de fuerza, escaneos de composición corporal, datos de nutrición, marcadores genéticos relacionados con la salud de los tejidos e informes semanales detallados de entrenamiento y lesiones. En total, esto produjo más de seis mil instantáneas semanales que vinculan cómo era el corredor y qué hacía con la aparición de problemas relacionados con la carrera.
Enseñar a los ordenadores a detectar el riesgo de lesión
Con este conjunto de datos en mano, el equipo entrenó varios tipos de modelos de aprendizaje automático para predecir si un corredor reportaría una nueva lesión relacionada con la carrera en una semana dada. Algunos modelos fueron simples y fáciles de interpretar, como la regresión logística, mientras que otros fueron más flexibles pero más opacos, como los bosques aleatorios, métodos de boosting, máquinas de vectores de soporte y redes neuronales. Los investigadores construyeron dos versiones principales de la tarea de predicción. Una utilizó solo factores de riesgo con fuerte respaldo científico previo, como sexo, edad, días de lesiones previas, ciertas medidas de fuerza y alineación, métricas clave de carga de entrenamiento y variantes genéticas seleccionadas. La otra versión incorporó un conjunto mucho más amplio de factores adicionales y más exploratorios para ver si el rendimiento del modelo mejoraba al aportar más información.

Lo que los modelos pudieron y no pudieron hacer
El enfoque de mejor rendimiento fue un método ensamblado llamado bosque aleatorio (random forest), que alcanzó un nivel moderado de exactitud (área bajo la curva alrededor de 0,78) al predecir el riesgo semanal de lesión. Este rendimiento supera ligeramente estudios previos que se centraron solo en datos de entrenamiento en corredores, y es comparable a los mejores resultados reportados en atletas mixtos de pista y campo. Curiosamente, la mayoría de los modelos no se beneficiaron de añadir simplemente más variables de evidencia más débil: su exactitud se mantuvo aproximadamente igual tanto si usaban una lista cuidadosamente seleccionada como si empleaban el conjunto de características más amplio. Una excepción notable fue la regresión logística, un método relativamente simple, que mejoró de forma marcada cuando se le dio el conjunto más amplio de variables y pasó de estar casi en la parte baja a situarse entre los mejores. En contraste, los modelos probabilísticos que dependían de fuertes supuestos de independencia entre variables funcionaron mal, probablemente porque muchos factores de riesgo están correlacionados o interactúan de formas complejas.
Límites actuales, potencial para herramientas futuras
A pesar del diseño cuidadoso, los modelos aún no son lo suficientemente precisos para uso clínico ni para tomar decisiones firmes de entrenamiento. Una razón principal es la escala: 142 corredores y algo más de 6000 muestras semanales son números pequeños para un problema tan complejo, especialmente al considerar la gran variedad en edad, nivel de competición, distancias preferidas y superficies de correr. El estudio también se apoyó en lesiones autoinformadas y algunas medidas poco frecuentes, como diarios alimentarios ocasionales, que pueden diluir cambios importantes a corto plazo. Además, los modelos se probaron solo dentro de este grupo único de corredores, por lo que no está claro hasta qué punto se generalizarían a nuevas poblaciones. Los autores sugieren que conjuntos de datos más grandes y combinados, junto con flujos de datos desde dispositivos wearables y seguimiento automatizado de dieta o sueño, podrían proporcionar la información más rica y frecuente que los modelos de aprendizaje automático necesitan para ofrecer predicciones más sólidas y fiables.
Qué significa esto para los corredores de a pie
Por ahora, esta investigación no produce una aplicación lista para usar que te diga exactamente cuándo te vas a lesionar. En cambio, ofrece un plano y un conjunto de datos públicos sobre el que otros científicos pueden trabajar. Muestra que los ordenadores pueden aprender patrones significativos a partir de una mezcla amplia y realista de información genética, física y de entrenamiento, pero también que predecir las lesiones al correr es intrínsecamente difícil. A medida que estudios futuros incorporen más corredores, mejores sensores y análisis más profundos, esta línea de trabajo podría finalmente alimentar herramientas de apoyo a la decisión que ofrezcan a los corredores orientación personalizada sobre cuánto entrenar, cuándo reducir la carga y qué factores modificables —como la fuerza o la nutrición— merecen atención adicional para mantenerlos corriendo sin dolor.
Cita: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y
Palabras clave: lesiones por correr, aprendizaje automático, medicina deportiva, predicción de lesiones, carrera de resistencia