Clear Sky Science · it

Predizione multidisciplinare degli infortuni correlati alla corsa mediante machine learning

· Torna all'indice

Perché questo interessa ai podisti

La corsa di resistenza è uno dei modi più diffusi per mantenersi in forma, ma quasi la metà dei corridori abituali subirà un infortunio significativo ogni anno. Questi problemi possono compromettere l’allenamento, peggiorare la qualità della vita e aumentare i costi sanitari. Questo studio pone una domanda pratica usando strumenti all’avanguardia: è possibile combinare informazioni sul corpo, lo stile di vita e l’allenamento di un corridore in un modello informatico che avvisi quando è a rischio di infortunio, prima che accada?

Figure 1
Figure 1.

Guardare l’intero corridore, non solo le scarpe

La maggior parte degli studi passati ha cercato di collegare gli infortuni della corsa a un singolo fattore alla volta—come volume di allenamento, tipo di scarpa o una misura isolata di forza. Ma gli infortuni reali nascono di solito da un intreccio di influenze: genetica, infortuni pregressi, forza muscolare, schemi di movimento, corporatura, alimentazione e come i carichi di allenamento cambiano nel tempo. In questo lavoro, i ricercatori hanno messo insieme un quadro raro e riccamente dettagliato di 142 corridori agonisti di resistenza, di età compresa tra 14 e 50 anni, seguiti per un anno intero. Per ciascun corridore hanno raccolto misure di laboratorio di ossa e muscoli, analisi del movimento dello stile di corsa, test di forza, scansioni della composizione corporea, dati nutrizionali, marcatori genetici legati alla salute dei tessuti e report settimanali dettagliati su allenamenti e infortuni. Complessivamente, questo ha prodotto più di seimila istantanee settimanali che collegano com’era il corridore e cosa faceva con il fatto che abbia sviluppato o meno un problema correlato alla corsa.

Insegnare ai computer a individuare il rischio di infortunio

Con questo dataset a disposizione, il team ha addestrato diversi tipi di modelli di machine learning per prevedere se un corridore avrebbe riportato un nuovo infortunio correlato alla corsa in una determinata settimana. Alcuni modelli erano semplici e facili da interpretare, come la regressione logistica, mentre altri erano più flessibili ma meno trasparenti, come le random forest, i metodi di boosting, le macchine a vettori di supporto e le reti neurali. I ricercatori hanno costruito due versioni principali del compito di predizione. Una utilizzava soltanto fattori di rischio con solido supporto scientifico a priori, come sesso, età, giorni di infortunio pregressi, determinate misure di forza e allineamento, metriche chiave del carico di allenamento e varianti genetiche selezionate. L’altra versione includeva un insieme molto più ampio di fattori aggiuntivi, più esplorativi, per verificare se le prestazioni del modello migliorassero fornendo più informazioni.

Figure 2
Figure 2.

Cosa i modelli sono riusciti e non sono riusciti a fare

L’approccio con le migliori prestazioni è stato un metodo ensemble chiamato random forest, che ha raggiunto un livello moderato di accuratezza (area sotto la curva intorno a 0,78) nella previsione del rischio settimanale di infortunio. Questa prestazione supera leggermente studi precedenti che si concentravano solo sui dati di allenamento nei corridori ed è paragonabile ai risultati migliori riportati in atleti di atletica leggera misti. È interessante notare che la maggior parte dei modelli non ha beneficiato semplicemente dell’aggiunta di variabili più deboli dal punto di vista delle evidenze: la loro accuratezza è rimasta più o meno la stessa indipendentemente dall’uso di una lista accuratamente curata o dell’insieme di caratteristiche più ampio. Un’eccezione notevole è stata la regressione logistica, un metodo relativamente semplice, che è migliorata in modo marcato quando le è stato dato il pool più vasto di variabili, salendo da livelli quasi inferiori a fra i migliori. Al contrario, i modelli probabilistici che si basavano su forti assunzioni di indipendenza tra le variabili hanno reso poco, probabilmente perché molti fattori di rischio sono correlati o interagiscono in modi complessi.

Limiti oggi, potenziale per gli strumenti di domani

Nonostante il disegno accurato, i modelli non sono ancora abbastanza precisi per uso clinico o per prendere decisioni definitive sull’allenamento. Una ragione principale è la scala: 142 corridori e poco più di 6000 campioni settimanali sono numeri modesti per un problema così complesso, specialmente considerando la grande varietà di età, livello di competizione, distanze preferite e superfici di corsa. Lo studio si è inoltre basato su infortuni auto-riportati e su alcune misure poco frequenti, come diari alimentari occasionali, che possono offuscare cambiamenti importanti a breve termine. Inoltre, i modelli sono stati testati solo su questo singolo gruppo di corridori, quindi non è chiaro quanto si generalizzerebbero a nuove popolazioni. Gli autori suggeriscono che dataset più ampi e aggregati, combinati con flussi di dati da dispositivi indossabili e monitoraggio automatico di dieta o sonno, potrebbero fornire informazioni più ricche e frequenti di cui i modelli di machine learning hanno bisogno per offrire previsioni più forti e affidabili.

Cosa significa per i corridori di tutti i giorni

Per il momento, questa ricerca non produce un’app pronta all’uso che ti dica esattamente quando ti farai male. Offre invece un progetto e un dataset pubblico su cui altri scienziati possono costruire. Dimostra che i computer possono apprendere pattern significativi da un mix ampio e realistico di informazioni genetiche, fisiche e di allenamento, ma anche che prevedere gli infortuni della corsa è intrinsecamente difficile. Man mano che studi futuri aggiungeranno più corridori, sensori migliori e analisi più approfondite, questa linea di ricerca potrebbe infine alimentare strumenti di supporto alle decisioni che forniscano ai podisti indicazioni personalizzate su quanto allenarsi, quando rallentare e quali fattori modificabili—come forza o alimentazione—meritano maggiore attenzione per mantenerli a correre senza dolore.

Citazione: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y

Parole chiave: infortuni da corsa, machine learning, medicina dello sport, predizione degli infortuni, corsa di resistenza