Clear Sky Science · de
Adaptive Optimierung der Trainingsbelastung für Bahnathleten: Ein Ansatz mit Reinforcement Learning
Schlaueres Training für Alltagsläufer
Wer schon einmal für ein Rennen trainiert hat, kennt den Drahtseilakt zwischen genug Druck zum Verbessern und dem Vermeiden von Übertraining, das in Erschöpfung oder Verletzung münden kann. Diese Studie zeigt, wie Ideen aus der künstlichen Intelligenz helfen können, tägliche Trainingspläne für Bahnsportler zu entwerfen, die auf den tatsächlichen Zustand des Körpers reagieren und nicht nur auf einen starren Fahrplan.
Warum einfache Pläne nicht ausreichen
Traditionelle Trainingsprogramme folgen oft einem starren Muster, bei dem Laufumfang oder Intensität jede Woche gesteigert werden, mit nur gelegentlichen Ruhephasen. Trainer passen anhand ihrer Erfahrung an, können aber die unsichtbare Ansammlung von Müdigkeit in jedem Athleten nicht genau verfolgen. Menschen unterscheiden sich in Schlaf, Stress und Erholung, sodass zwei Läufer mit demselben Plan sehr unterschiedlich reagieren können. Infolgedessen stagnieren manche Athleten, andere brechen zusammen, und geplante Ziele werden über eine lange Saison hinweg oft verfehlt.

Den Athleten als digitalen Zwilling abbilden
Die Forschenden sammelten tägliche Detaildaten von 25 Bahnathleten über eine 24‑wöchige Saison. Täglich wurden Herzfrequenzvariabilität, ein uhrbasierter Schlafqualitätswert und Trainingsbelastungsmaße erfasst, die sowohl kurz- als auch langfristige Anstrengung abbilden. Außerdem wurde ein Leistungsmaß verfolgt: die wöchentliche Zeit für einen 400‑Meter‑Lauf. Aus diesen Aufzeichnungen bauten sie einen Computer‑Ersatz, einen digitalen Zwilling, eines Athleten. Dieser digitale Zwilling kann vorhersagen, wie sich Leistung und Körpersignale verändern würden, wenn das Training an einem bestimmten Tag härter, länger oder leichter gestaltet würde, ohne am realen Menschen zu experimentieren.
Wie der smarte Coach lernt
Auf Basis dieses digitalen Zwillings trainierte das Team ein Entscheidungssystem, das auf Deep Reinforcement Learning beruht. In jedem Schritt sieht das System den aktuellen Zustand des Athleten als sechsteilige Momentaufnahme von Körpersignalen, Schlaf, Arbeitslast und Leistung. Anschließend wählt es eine von drei Aktionen: Trainingsintensität erhöhen, Trainingsumfang erhöhen oder aktive Erholung verordnen. Nach jeder Wahl zeigt der digitale Zwilling den neuen Zustand, und das System erhält eine Bewertung, die schnellere 400‑Meter‑Zeiten belohnt, aber Überlastungszeichen bestraft, wie sehr hohe kurzfristige Arbeitslast im Vergleich zur langfristigen Arbeitslast oder Abnahmen der Herzfrequenzvariabilität und Schlafqualität. Über viele tausend simulierte Wochen lernt das System, welche Entscheidungsmuster zu langfristigen Verbesserungen führen, ohne in riskantes Terrain abzudriften.
Wie es im Vergleich zu menschlichen Planungen abschneidet
Die Autoren verglichen ihren adaptiven Planer mit mehreren realistischen Alternativen, darunter ein fester Plan, der die Belastung jede Woche erhöht, ein handgefertigtes Regelwerk, das die Arbeitslast einfach in einem sicheren Bereich hält, eine Machine‑Learning‑Regel, die immer der besten kurzfristigen Belohnung nachjagt, und ein klassischer tabellenbasierter Reinforcement‑Learner. Alle Ansätze verbesserten die 400‑Meter‑Zeiten über die Saison, doch das adaptive Deep‑Learning‑System erzielte die größten Zuwächse und geriet dabei fast nie in den Gefahrenbereich hinsichtlich Verletzungsrisiko. Im Gegensatz dazu schoben die statischen und gierigen Methoden die wöchentliche Belastung häufig in unsichere Bereiche, und das rein gesundheitsorientierte Design hielt die Athleten zwar sicher, opferte jedoch einen Großteil des möglichen Geschwindigkeitsgewinns.

Was das für Athleten und Trainer bedeutet
Für den Laien ist die Kernbotschaft: Training muss kein Ratespiel sein. Indem man einfachen Körpersignalen wie Herzrhythmus, Schlaf und der Härte jüngster Einheiten genau zuhört und ein Lernsystem viele Was‑wäre‑wenn‑Szenarien in Simulationen testen lässt, können Trainer tägliche Trainingsvorschläge erzeugen, die zugleich ehrgeizig und vorsichtig sind. Zwar ist diese Studie ein früher Proof of Concept mit einer kleinen Gruppe von Bahnathleten und vereinfachten Entscheidungen, doch sie zeigt, dass ein ausgewogener, dateninformierter Ansatz Athleten helfen kann, schneller zu werden und gleichzeitig drastisch die Zeit zu reduzieren, die sie in Hochrisikozuständen verbringen.
Zitation: Zhang, Q., Wang, Q. & Niu, Y. Adaptive training load optimization for track and field athletes: A reinforcement learning approach. Sci Rep 16, 14862 (2026). https://doi.org/10.1038/s41598-026-41946-w
Schlüsselwörter: Trainingsbelastung, Reinforcement Learning, Bahn- und Feldsport, Verletzungsrisiko, Herzfrequenzvariabilität