Clear Sky Science · ja

機械学習を用いたランニング関連傷害の学際的予測

· 一覧に戻る

ランナーにとってなぜ重要か

持久ランニングは健康維持の最も人気のある方法の一つですが、定期的に走る人のほぼ半数は毎年何らかの重大な傷害を経験します。こうした問題はトレーニングを妨げ、生活の質を損ない、医療費をかさませることがあります。本研究は実用的な問いを最先端の手法で検証します:ランナーの身体、生活様式、トレーニングに関する情報をコンピュータモデルに統合して、実際に傷害が発生する前にその兆候を警告できるか、という問いです。

Figure 1
Figure 1.

靴だけでなくランナー全体を捉える

これまでの多くの研究は、トレーニング量やシューズの種類、特定の筋力測定など、単一の要因とランニング傷害を結びつけようとしました。しかし現実の傷害は通常、遺伝、既往歴、筋力、動作パターン、体格、食事、トレーニング負荷の変化など複数の要因が絡み合って生じます。本研究では、研究者たちが14~50歳の競技志向の持久ランナー142名を1年間詳細に追跡し、例外的に豊富で精緻なデータセットを作成しました。各ランナーについて、骨や筋肉の研究室測定、走行時の動作解析、筋力テスト、体組成スキャン、栄養データ、組織の健康に関連する遺伝子マーカー、そして毎週の詳細なトレーニングと傷害の報告を収集しました。合計で、ランナーの状態や行動とランニング関連の問題が発生したかどうかを結びつける6000以上の週次スナップショットが得られました。

コンピュータに傷害リスクを見分けさせる

このデータセットを用いて、研究チームはある週にランナーが新たなランニング関連傷害を報告するかどうかを予測するために、いくつかの種類の機械学習モデルを訓練しました。ロジスティック回帰のように単純で解釈しやすいモデルから、ランダムフォレスト、ブースティング法、サポートベクターマシン、ニューラルネットワークなど柔軟だがブラックボックス的な手法まで含まれます。予測タスクは主に二つのバージョンで構築されました。一方は性別、年齢、既往の傷害日数、特定の筋力やアライメントの指標、主要なトレーニング負荷指標、選択された遺伝子変異など、科学的裏付けが強いリスク因子のみを用いるものです。もう一方は、より探索的な追加因子を幅広く含めて、情報を増やすことでモデルの性能が向上するかを検証しました。

Figure 2
Figure 2.

モデルができたこと、できなかったこと

最も良好な成績を示したのはランダムフォレストというアンサンブル法で、週次の傷害リスクを予測する際に中程度の精度(曲線下面積が約0.78)を達成しました。この性能は、ランナーのトレーニングデータだけに着目した過去の研究をやや上回り、混合トラック・フィールド選手で報告された良好な結果と同等です。興味深いことに、ほとんどのモデルは単純に弱い根拠の変数を追加したからといって性能が向上するわけではなく、慎重に選んだ変数リストを使うかフルの大きな特徴セットを使うかで精度はほぼ変わりませんでした。例外として、比較的単純なロジスティック回帰は、より広い変数群が与えられると成績が大きく改善し、下位付近から上位の成績へと移りました。対照的に、変数間の強い独立性を仮定する確率的モデルは性能が悪かった。これは多くのリスク因子が相関したり複雑に相互作用したりするためと考えられます。

現在の限界と将来のツールの可能性

慎重に設計された研究ではありますが、現時点でモデルは臨床利用や確固たるトレーニング判断に十分な精度には達していません。主な理由の一つは規模です:142名のランナーと約6000週分のサンプルは、このように複雑な問題に対しては小さな数字であり、年齢、競技レベル、好みの距離、走る路面の多様性を考えると特に十分とは言えません。また、本研究は自己申告の傷害と、時折の食事日誌のような頻度の低い測定に依存しており、重要な短期的変化をぼやけさせる可能性があります。加えて、モデルはこの単一のランナー群内でのみ検証されているため、新しい集団にどの程度一般化できるかは不明です。著者らは、より大規模なプールデータセットとウェアラブルや自動化された食事・睡眠トラッキングなどのデータストリームを組み合わせることで、機械学習モデルがより強力で信頼できる予測を提供するために必要な、より頻繁で豊富な情報が得られると示唆しています。

日常のランナーにとっての意味

現時点では、この研究は「いつ怪我をするか」を正確に教えてくれる既製のアプリを生み出すものではありません。むしろ、他の研究者が発展させられる設計図と公開データセットを提供します。遺伝的、身体的、トレーニング情報を幅広く現実的に組み合わせることで、コンピュータは有意義なパターンを学べることを示す一方で、ランニング傷害の予測が本質的に難しいことも示しています。将来的により多くのランナー、より優れたセンサー、より深い解析が加われば、この研究はトレーニング強度の調整時期やゆるめるべきタイミング、筋力や栄養など注意すべき改善可能な要素について個別化された意思決定支援ツールを支える可能性があります。

引用: Wu, H., Brooke-Wavell, K., Barnes, M.R. et al. Multidisciplinary prediction of running-related injuries using machine learning. npj Digit. Med. 9, 213 (2026). https://doi.org/10.1038/s41746-026-02413-y

キーワード: ランニング傷害, 機械学習, スポーツ医学, 傷害予測, 持久系ランニング