Clear Sky Science · pt

Previsão multidisciplinar de lesões relacionadas à corrida usando aprendizado de máquina

· Voltar ao índice

Por que isso importa para corredores

A corrida de endurance é uma das maneiras mais populares de manter a forma, mas quase metade dos corredores regulares sofrerá uma lesão significativa a cada ano. Esses problemas podem atrapalhar o treinamento, reduzir a qualidade de vida e gerar custos médicos elevados. Este estudo faz uma pergunta prática usando ferramentas de ponta: podemos combinar informações sobre o corpo, o estilo de vida e o treinamento de um corredor em um modelo computacional que alerte quando ele está caminhando para uma lesão, antes que ela aconteça?

Figure 1
Figure 1.

Olhando para o corredor como um todo, não apenas para os tênis

A maioria dos estudos anteriores tentou ligar lesões na corrida a um único fator por vez — como volume de treinamento, tipo de tênis ou alguma medida isolada de força. Mas lesões no mundo real geralmente surgem de um emaranhado de influências: genética, lesões passadas, força muscular, padrões de movimento, tipo corporal, alimentação e como as cargas de treinamento mudam ao longo do tempo. Neste trabalho, os pesquisadores reuniram um quadro raro e detalhado de 142 corredores competitivos de endurance, de 14 a 50 anos, acompanhados por um ano completo. Para cada corredor coletaram medidas laboratoriais de osso e músculo, análise de movimento do estilo de corrida, testes de força, exames de composição corporal, dados nutricionais, marcadores genéticos relacionados à saúde dos tecidos e relatórios semanais detalhados de treinamento e lesões. No total, isso gerou mais de seis mil instantâneos semanais vinculando como o corredor era e o que ele fazia ao aparecimento de problemas relacionados à corrida.

Ensinando computadores a identificar risco de lesão

Com esse conjunto de dados em mãos, a equipe treinou vários tipos de modelos de aprendizado de máquina para prever se um corredor relataria uma nova lesão relacionada à corrida em uma determinada semana. Alguns modelos eram simples e fáceis de interpretar, como regressão logística, enquanto outros eram mais flexíveis porém mais opacos, como florestas aleatórias, métodos de boosting, máquinas de vetores de suporte e redes neurais. Os pesquisadores construíram duas versões principais da tarefa de previsão. Uma usou apenas fatores de risco com forte apoio prévio na literatura, como sexo, idade, dias de lesão anterior, certas medidas de força e alinhamento, métricas-chave de carga de treinamento e variantes genéticas selecionadas. A outra versão incluiu um conjunto muito mais amplo de fatores adicionais e mais exploratórios para verificar se o desempenho do modelo melhorava com mais informações disponíveis.

Figure 2
Figure 2.

O que os modelos podiam e não podiam fazer

A abordagem com melhor desempenho foi um método em ensemble chamado floresta aleatória, que alcançou um nível moderado de acurácia (área sob a curva em torno de 0,78) ao prever o risco semanal de lesão. Esse desempenho supera ligeiramente estudos anteriores que se concentraram apenas em dados de treinamento de corredores e é comparável aos melhores resultados relatados em atletas mistos de pista e campo. Curiosamente, a maioria dos modelos não se beneficiou simplesmente de adicionar mais variáveis de evidência mais fraca: sua acurácia permaneceu aproximadamente a mesma independentemente de usarem uma lista cuidadosamente selecionada ou o conjunto maior e completo de características. Uma exceção notável foi a regressão logística, um método relativamente simples, que melhorou de forma marcante quando recebeu o conjunto mais amplo de variáveis e saiu de perto da parte inferior para estar entre os melhores desempenhos. Em contraste, modelos probabilísticos que dependiam de suposições fortes de independência entre variáveis tiveram desempenho ruim, provavelmente porque muitos fatores de risco são correlacionados ou interagem de maneiras complexas.

Limites hoje, potencial para ferramentas amanhã

Apesar do desenho cuidadoso, os modelos ainda não são suficientemente acurados para uso clínico ou para tomar decisões firmes de treinamento. Uma razão principal é a escala: 142 corredores e pouco mais de 6000 amostras semanais são números pequenos para um problema tão complexo, especialmente considerando a grande variedade de idades, níveis de competição, distâncias preferidas e superfícies de corrida. O estudo também se apoiou em lesões autorrelatadas e em algumas medidas pouco frequentes, como diários alimentares ocasionais, que podem borrar mudanças importantes em curto prazo. Além disso, os modelos foram testados apenas dentro desse único grupo de corredores, então não se sabe quão bem se generalizariam para novas populações. Os autores sugerem que conjuntos de dados maiores e agregados, combinados com fluxos de dados de wearables e rastreamento automatizado de dieta ou sono, poderiam fornecer informações mais ricas e frequentes de que os modelos de aprendizado de máquina precisam para entregar previsões mais fortes e confiáveis.

O que isso significa para corredores do dia a dia

Por enquanto, esta pesquisa não produz um aplicativo pronto que diga exatamente quando você vai se machucar. Em vez disso, oferece um roteiro e um conjunto de dados público que outros cientistas podem utilizar. Mostra que computadores podem aprender padrões significativos a partir de uma mistura ampla e realista de informações genéticas, físicas e de treinamento, mas também que prever lesões na corrida é inerentemente difícil. À medida que estudos futuros incluírem mais corredores, sensores melhores e análises mais profundas, essa linha de trabalho poderá, eventualmente, alimentar ferramentas de apoio à decisão que ofereçam aos corredores orientações personalizadas sobre quanto treinar, quando reduzir a intensidade e quais fatores modificáveis — como força ou nutrição — merecem atenção extra para mantê‑los correndo sem dor.

Citação: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y

Palavras-chave: lesões na corrida, aprendizado de máquina, medicina esportiva, previsão de lesões, corrida de endurance