Clear Sky Science · fr

Prédiction multidisciplinaire des blessures liées à la course à l’aide de l’apprentissage automatique

· Retour à l’index

Pourquoi c’est important pour les coureurs

La course d’endurance est l’un des moyens les plus répandus de rester en forme, mais près de la moitié des coureurs réguliers souffrent d’une blessure significative chaque année. Ces problèmes peuvent compromettre l’entraînement, détériorer la qualité de vie et engendrer des frais médicaux importants. Cette étude pose une question pratique avec des outils de pointe : peut-on combiner des informations sur le corps, le mode de vie et l’entraînement d’un coureur dans un modèle informatique qui alerte lorsqu’il s’approche d’une blessure, avant qu’elle ne survienne ?

Figure 1
Figure 1.

Regarder le coureur dans sa globalité, pas seulement les chaussures

La plupart des études précédentes ont tenté d’attribuer les blessures de course à un seul facteur à la fois — par exemple le volume d’entraînement, le type de chaussure ou une mesure de force isolée. Mais les blessures en situation réelle résultent généralement d’un enchevêtrement d’influences : génétique, antécédents de blessures, force musculaire, schémas de mouvement, morphologie, alimentation et variations des charges d’entraînement au fil du temps. Dans ce travail, les chercheurs ont constitué un jeu de données rare et très détaillé de 142 coureurs d’endurance compétitifs, âgés de 14 à 50 ans, suivis pendant un an complet. Pour chaque coureur, ils ont recueilli des mesures en laboratoire des os et des muscles, une analyse de la cinématique de course, des tests de force, des bilans de composition corporelle, des données nutritionnelles, des marqueurs génétiques liés à la santé tissulaire et des rapports hebdomadaires détaillés d’entraînement et de blessures. Au total, cela a produit plus de six mille instantanés hebdomadaires reliant l’état et le comportement du coureur à l’apparition éventuelle d’un problème lié à la course.

Apprendre aux ordinateurs à repérer le risque de blessure

Avec cet ensemble de données, l’équipe a entraîné plusieurs types de modèles d’apprentissage automatique pour prédire si un coureur rapporterait une nouvelle blessure liée à la course au cours d’une semaine donnée. Certains modèles étaient simples et faciles à interpréter, comme la régression logistique, tandis que d’autres étaient plus flexibles mais plus opaques, tels que les forêts aléatoires, les méthodes de boosting, les machines à vecteurs de support et les réseaux de neurones. Les chercheurs ont construit deux versions principales de la tâche de prédiction. L’une utilisait uniquement des facteurs de risque bénéficiant d’un solide soutien scientifique a priori, comme le sexe, l’âge, les jours d’antécédents de blessure, certaines mesures de force et d’alignement, des indicateurs clés de charge d’entraînement et des variants génétiques sélectionnés. L’autre version ajoutait un ensemble beaucoup plus large de facteurs supplémentaires, plus exploratoires, pour vérifier si les performances du modèle s’amélioraient quand davantage d’informations étaient fournies.

Figure 2
Figure 2.

Ce que les modèles pouvaient et ne pouvaient pas faire

L’approche la plus performante fut une méthode ensembliste appelée forêt aléatoire, qui a atteint un niveau d’exactitude modéré (aire sous la courbe d’environ 0,78) pour la prédiction du risque hebdomadaire de blessure. Cette performance dépasse légèrement les études antérieures centrées uniquement sur les données d’entraînement des coureurs, et est comparable aux meilleurs résultats rapportés chez des athlètes de piste et de terrain mélangés. Fait intéressant, la plupart des modèles n’ont pas tiré profit de l’ajout de variables supplémentaires à moindre niveau de preuve : leur précision est restée sensiblement la même, qu’ils utilisent une liste soigneusement choisie ou l’ensemble plus large de caractéristiques. Une exception notable fut la régression logistique, méthode relativement simple, qui s’est améliorée de façon marquée lorsqu’on lui a fourni le pool plus large de variables et est passée d’une performance médiocre à l’une des meilleures. En revanche, les modèles probabilistes reposant sur de fortes hypothèses d’indépendance entre variables ont été peu performants, vraisemblablement parce que de nombreux facteurs de risque sont corrélés ou interagissent de manière complexe.

Limites actuelles, potentiel pour des outils futurs

Malgré une conception rigoureuse, les modèles ne sont pas encore suffisamment précis pour un usage clinique ou pour prendre des décisions d’entraînement définitives. Une raison majeure est l’échelle : 142 coureurs et un peu plus de 6000 échantillons hebdomadaires sont des effectifs faibles pour un problème aussi complexe, surtout compte tenu de la grande diversité d’âges, de niveaux de compétition, de distances privilégiées et de surfaces de course. L’étude s’est aussi appuyée sur des blessures auto-déclarées et sur des mesures parfois peu fréquentes, comme des journaux alimentaires occasionnels, ce qui peut estomper des changements à court terme importants. De plus, les modèles n’ont été testés que dans ce groupe unique de coureurs, si bien qu’il est incertain qu’ils se généralisent à de nouvelles populations. Les auteurs suggèrent que des jeux de données plus larges et fédérés, combinés à des flux de données provenant de capteurs portables et d’un suivi automatisé de l’alimentation ou du sommeil, pourraient fournir des informations plus riches et plus fréquentes, dont les modèles d’apprentissage automatique ont besoin pour produire des prédictions plus robustes et plus fiables.

Ce que cela signifie pour les coureurs au quotidien

Pour l’instant, cette recherche ne fournit pas une application prête à l’emploi qui vous indique exactement quand vous serez blessé. En revanche, elle propose une feuille de route et un jeu de données public sur lesquels d’autres chercheurs peuvent s’appuyer. Elle montre que les ordinateurs peuvent apprendre des motifs pertinents à partir d’un mélange large et réaliste d’informations génétiques, physiques et d’entraînement, mais aussi que la prédiction des blessures en course reste intrinsèquement difficile. À mesure que les études futures ajouteront davantage de coureurs, de meilleurs capteurs et des analyses plus approfondies, cette voie de recherche pourrait finir par alimenter des outils d’aide à la décision fournissant aux coureurs des conseils personnalisés sur l’intensité d’entraînement, le moment où il convient de lever le pied et les facteurs modifiables — comme la force ou la nutrition — qui méritent une attention particulière pour les maintenir en course sans douleur.

Citation: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y

Mots-clés: blessures en course, apprentissage automatique, médecine du sport, prédiction des blessures, course d’endurance