Clear Sky Science · ru
Мультидисциплинарный прогноз травм при беге с помощью машинного обучения
Почему это важно для бегунов
Бег на выносливость — один из самых популярных способов поддерживать форму, но почти половина регулярных бегунов ежегодно сталкивается с серьёзной травмой. Такие проблемы могут нарушить подготовку, ухудшить качество жизни и повлечь значительные медицинские расходы. В этом исследовании задаётся практический вопрос с применением современных инструментов: можно ли объединить данные о теле бегуна, образе жизни и тренировках в компьютерную модель, которая предупредит о повышенном риске травмы ещё до её возникновения?

Рассматривая бегуна целиком, а не только обувь
Большинство предыдущих исследований пытались связать травмы при беге с одним фактором — например, объёмом тренировок, типом обуви или одной мерой силы. Но реальные травмы обычно возникают из переплетения множества влияний: генетики, прошлых травм, силы мышц, паттернов движения, телосложения, питания и изменений тренировочных нагрузок со временем. В этой работе исследователи собрали редкий, подробно охарактеризованный набор данных о 142 соревнующихся бегунах на выносливость в возрасте от 14 до 50 лет, наблюдавшихся в течение целого года. Для каждого бегуна были получены лабораторные измерения костной и мышечной ткани, анализ движений при беге, тесты на силу, сканирование состава тела, данные о питании, генетические маркёры, связанные со здоровьем тканей, а также подробные еженедельные отчёты о тренировках и травмах. В сумме это дало более шести тысяч еженедельных снимков, связывающих характеристики бегуна и его активность с тем, развилась ли у него травма, связанная с бегом.
Обучение компьютеров выявлять риск травмы
Имея этот набор данных, команда обучила несколько типов моделей машинного обучения прогнозировать, сообщит ли бегун о новой травме, связанной с бегом, в конкретную неделю. Некоторые модели были простыми и легко интерпретируемыми, например логистическая регрессия, в то время как другие были более гибкими, но менее прозрачными — случайные леса, бустинг, методы опорных векторов и нейронные сети. Исследователи построили две основные версии задачи прогнозирования. Одна использовала только факторы риска с сильной научной поддержкой, такие как пол, возраст, количество дней с прошлой травмой, определённые показатели силы и выравнивания, ключевые метрики тренировочной нагрузки и выбранные генетические варианты. Другая версия включала гораздо более широкий набор дополнительных, исследовательских факторов, чтобы проверить, улучшится ли качество модели при добавлении большего объёма информации.

Что модели могли и не могли сделать
Лучший результат показал ансамблевый метод — случайный лес, который достиг умеренной точности (площадь под кривой примерно 0,78) при прогнозировании еженедельного риска травмы. Это немного превосходит предыдущие исследования, фокусировавшиеся только на данных о тренировках бегунов, и сопоставимо с лучшими результатами, полученными на смешанных выборках легкоатлетов. Интересно, что большинству моделей не помогало простое добавление множества переменных с более слабой поддержкой: их точность оставалась примерно на том же уровне независимо от того, использовали ли они тщательно подобранный список или полный, больший набор признаков. Замечательное исключение — логистическая регрессия, относительно простой метод, который заметно улучшился при расширении пула переменных и поднялся с почти худших позиций в число лучших исполнителей. Напротив, вероятностные модели, опиравшиеся на жёсткие предположения о независимости переменных, показали плохие результаты — вероятно, потому, что многие факторы риска коррелируют между собой или взаимодействуют сложными способами.
Ограничения сегодня, потенциал для инструментов завтра
Несмотря на тщательную организацию, модели ещё недостаточно точны для клинического применения или для принятия окончательных тренировочных решений. Одна из главных причин — масштаб: 142 бегуна и чуть более 6000 еженедельных наблюдений — это небольшие числа для столь сложной задачи, особенно с учётом разнообразия по возрасту, уровню соревнований, предпочтительным дистанциям и типам поверхностей. Исследование также опиралось на самоотчёты о травмах и некоторые редкие измерения, например время от времени ведённые дневники питания, что могло сгладить важные краткосрочные изменения. Кроме того, модели тестировались только на этой одной когорте бегунов, поэтому неясно, насколько хорошо они будут обобщаться на другие популяции. Авторы предлагают, что более крупные объединённые наборы данных в сочетании с потоками данных от носимых устройств и автоматизированным отслеживанием питания или сна могут обеспечить более частую и насыщенную информацию, необходимую моделям машинного обучения для более сильных и надёжных прогнозов.
Что это значит для обычных бегунов
Пока что это исследование не даёт готового приложения, которое точно скажет, когда вы получите травму. Вместо этого оно предлагает рабочую схему и публичный набор данных, на которых другие учёные могут строить дальнейшие исследования. Работа демонстрирует, что компьютеры могут извлекать значимые закономерности из широкого, реалистичного набора генетической, физической и тренировочной информации, но также показывает, что прогнозирование травм при беге по своей природе сложно. По мере того как будущие исследования привлекут больше бегунов, лучшие сенсоры и более глубокий анализ, эта линия работы в конечном счёте может привести к инструментам поддержки принятия решений, которые будут давать персонализированные рекомендации о том, насколько интенсивно тренироваться, когда снизить нагрузку и на какие модифицируемые факторы — например силу или питание — стоит обратить больше внимания, чтобы оставаться в беге без боли.
Цитирование: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y
Ключевые слова: травмы при беге, машинное обучение, спортивная медицина, прогнозирование травм, бег на выносливость