Clear Sky Science · sv

Multidisciplinär prediktion av löprelaterade skador med maskininlärning

· Tillbaka till index

Varför detta är viktigt för löpare

Uthållighetslöpning är ett av de mest populära sätten att hålla sig i form, men nästan hälften av regelbundna löpare drabbas av en betydande skada varje år. Dessa problem kan rubba träningen, försämra livskvaliteten och ge upphov till höga vårdkostnader. Denna studie ställer en praktisk fråga med moderna verktyg: kan vi kombinera information om en löpares kropp, livsstil och träning i en datormodell som varnar när risken för skada ökar — innan skadan inträffar?

Figure 1
Figure 1.

Att betrakta hela löparen, inte bara skorna

De flesta tidigare studier har försökt koppla löparskador till en enskild faktor i taget — exempelvis träningsvolym, sko­typ eller en styrkemätning. I verkligheten uppstår skador ofta ur en sammansatt väv av påverkan: genetik, tidigare skador, muskelstyrka, rörelsemönster, kroppstyp, kost och hur träningsbelastningen förändras över tid. I detta arbete samlade forskarna en ovanligt rik och detaljerad bild av 142 tävlingslöpare för uthållighet, i åldrarna 14 till 50 år, följda under ett helt år. För varje löpare mätte de ben- och muskelparametrar i labb, rörelseanalys av löpteknik, styrketester, kroppskompositionsskanningar, näringsdata, genetiska markörer kopplade till vävnadshälsa samt detaljrika veckorapporter om träning och skador. Totalt gav detta mer än sex tusen veckovisa ögonblicksbilder som länkar hur löparen var och vad hen gjorde till om en löprelaterad problematik utvecklades.

Att lära datorer att upptäcka skaderisk

Med denna datamängd tränade teamet flera typer av maskininlärningsmodeller för att förutsäga om en löpare skulle rapportera en ny löprelaterad skada under en viss vecka. Vissa modeller var enkla och lätta att tolka, som logistisk regression, medan andra var mer flexibla men mer svårgreppbara, såsom random forests, boosting-metoder, supportvektormaskiner och neurala nätverk. Forskarna byggde två huvudvarianter av prediktionsuppgiften. Den ena använde endast riskfaktorer med starkt vetenskapligt stöd i förväg, såsom kön, ålder, tidigare skadedagar, vissa styrke- och alignmentsmått, nyckel­mått för träningsbelastning och utvalda genvarianter. Den andra varianten inkluderade en mycket bredare uppsättning ytterligare, mer explorativa faktorer för att se om modellens prestanda förbättrades när mer information gavs.

Figure 2
Figure 2.

Vad modellerna kunde och inte kunde göra

Den bäst presterande metoden var ett ensemble-baserat angreppssätt kallat random forest, som nådde en måttlig noggrannhet (area under curve omkring 0,78) vid prediktion av veckovis skaderisk. Denna prestanda överträffar något tidigare studier som enbart fokuserat på träningsdata hos löpare, och är jämförbar med vissa bättre resultat rapporterade i blandade friidrottsgrupper. Intressant nog förbättrades de flesta modeller inte genom att man helt enkelt lade till fler variabler med svagare evidens: deras noggrannhet förblev ungefär densamma oavsett om de använde en noggrant kurerad lista eller hela den större funktionsmängden. Ett anmärkningsvärt undantag var logistisk regression, en relativt enkel metod, som förbättrades markant när den fick tillgång till den bredare poolen av variabler och klättrade från nära botten till att bli en av de bättre presterande. Däremot fungerade probabilistiska modeller som byggde på starka antaganden om oberoende mellan variabler dåligt, sannolikt därför att många riskfaktorer är korrelerade eller interagerar på komplexa sätt.

Begränsningar i dag, potential för verktyg i morgon

Trots omsorgsfull design är modellerna ännu inte tillräckligt precisa för klinisk användning eller för att fatta avgörande träningsbeslut. En viktig anledning är skalan: 142 löpare och drygt 6000 veckoprover är små tal för ett så komplext problem, särskilt med tanke på stor variation i ålder, tävlingsnivå, föredragna distanser och underlag. Studien förlitade sig också på självrapporterade skador och vissa sporadiska mätningar, såsom tillfälliga matdagböcker, vilket kan sudda ut viktiga kortsiktiga förändringar. Dessutom testades modellerna endast inom denna enda löpargrupp, så det är oklart hur väl de generaliserar till nya populationer. Författarna föreslår att större, sammanslagna dataset, kombinerat med dataströmmar från bärbar teknik och automatiserad kost- eller sömnspårning, kan ge den rikare, mer frekventa information som maskininlärningsmodeller behöver för att leverera starkare och mer pålitliga prediktioner.

Vad detta betyder för vardagslöpare

För närvarande ger inte denna forskning en färdig app som säger exakt när du kommer att skadas. I stället erbjuder den en ritning och en offentlig datamängd som andra forskare kan bygga vidare på. Den visar att datorer kan lära sig meningsfulla mönster ur en bred, realistisk blandning av genetisk, fysisk och träningsrelaterad information, men också att prediktion av löparskador är inneboende svår. När framtida studier lägger till fler löpare, bättre sensorer och djupare analys, kan denna forskningslinje så småningom driva beslutsstödverktyg som ger löpare personligt anpassad vägledning om hur hårt de bör träna, när de bör trappa ner och vilka modifierbara faktorer — såsom styrka eller näring — som förtjänar extra uppmärksamhet för att hålla dem skadefria.

Citering: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y

Nyckelord: löparskador, maskininlärning, idrottsmedicin, skadeprediktion, uthållighetslöpning