Clear Sky Science · de
PoseShot: hybrides CNN–BiLSTM-Transformer-Modell zur Erkennung von Freiwurf-Aktionen durch Haltungsanalyse
Schlaueres Training für einen klassischen Korbwurf
Für jeden, der jemals an der Freiwurflinie stand, kann der Unterschied zwischen Swish und Fehlwurf mysteriös wirken. Diese Studie zeigt, wie künstliche Intelligenz dieses Rätsel in klares, objektives Feedback verwandeln kann. Indem sie die Körperhaltung eines Spielers während eines Freiwurfs genau analysiert, zerlegt das System der Forscher, PoseShot genannt, den Wurf in verständliche Phasen und zeigt auf, welche Bewegungen eine saubere Technik von einer wackeligen unterscheiden.

Einen Freiwurf in klare Phasen zerlegen
Anstatt einen Freiwurf als eine einzige, einfache Aktion zu behandeln, betrachtet PoseShot ihn als Sequenz aus fünf klar unterscheidbaren Phasen: Dribbeln, Halten, Anheben, Werfen und Follow-through. Das Team sammelte 75 Videos von Spielern, die Freiwürfe in verschiedenen Hallen, Lichtverhältnissen und Kamerawinkeln ausführten, und kennzeichnete tausende Einzelbilder mit diesen Phasennamen. Dieser fein abgestufte Ansatz erlaubt dem System viel spezifischere Fragen: Hält der Spieler lange genug in der Haltephase inne? Verläuft der Armweg während des Anhebens gleichmäßig? Ist das Follow-through von Wurf zu Wurf konsistent?
Den Körper mit Computer Vision lesen
Um zu erkennen, was der Spieler tut, kombiniert PoseShot zwei komplementäre Sichtweisen derselben Bewegung. Erstens analysiert es die Rohvideo-Bilder und nutzt eine Art neuronales Netzwerk, bekannt als Convolutional Network, um Formen, Gliedmaßenpositionen und Bewegungszeichen in jedem Bild zu erfassen. Zweitens läuft das Video durch ein Pose-Estimations-Tool, das 2D-Gelenkpositionen am ganzen Körper markiert. Aus diesen Punkten berechnet es acht entscheidende Gelenkwinkel, darunter beide Ellbogen, Hüften und Knie. Diese Winkel bilden eine Art numerischen Fingerabdruck der Körperhaltung über die Zeit und erfassen, wie Energie von den Beinen über den Rumpf zum Wurfarm fließt.

Zwei Ströme von Bewegungsintelligenz verschmelzen
Der Kern von PoseShot ist eine duale Architektur, die Bilder und Haltung nebeneinander verarbeitet. Der Bildstrom durchläuft mehrere Schichten, die visuelle Details schrittweise zu kompakten Merkmalen verdichten. Der Haltungsstrom speist die Sequenz der Gelenkwinkel in ein spezielles zeitbewusstes Netzwerk, das verfolgt, wie eine Körperposition zur nächsten führt, sowohl vorwärts als auch rückwärts in der Zeit. Auf beiden Strömen baut das System Transformer-Schichten auf, die wie Aufmerksamkeitsmechanismen wirken und die informativsten Momente und Beziehungen in der Bewegung hervorheben. Schließlich werden die beiden Ströme zusammengeführt und an einen Klassifikator übergeben, der Bild für Bild entscheidet, in welcher Phase des Freiwurfs sich der Spieler befindet.
Bessere Ergebnisse als andere KI-Coaches
Um die Leistung von PoseShot zu beurteilen, verglichen die Forscher es mit einer Reihe populärer Deep-Learning-Modelle, von klassischen Bildnetzwerken bis hin zu modernen Transformer-basierten Entwürfen. Mit einer ausgewogenen Metrik, die sowohl präzise Treffer als auch das Vermeiden von Fehlern honoriert, erreichte PoseShot etwa 96 von 100 Punkten, übertraf damit alle konkurrierenden Methoden insgesamt und zeigte besonders starke Leistung in der entscheidenden Wurfphase. Das System war besonders gut darin, klar abgegrenzte Bewegungen wie Halten, Werfen und Follow-through zu erkennen. Am schwierigsten waren die Unterscheidungen zwischen Dribbeln und Anheben, die im Spiel oft ineinander übergehen und sich eher in feinem Timing und Geschwindigkeit als in deutlichen Haltungsänderungen unterscheiden.
Von Daten zu verwertbarem Coaching
Indem es Hochgeschwindigkeitsvideo und Gelenkmessungen in zuverlässige Phasenlabels verwandelt, bietet PoseShot Trainern mehr als nur ein Highlight-Video. Es liefert eine strukturierte Methode, um zu erkennen, wo die Technik eines Spielers zusammenbricht, wie konsistent er Schlüsselpositionen wiederholt und welche Teile der Bewegung getroffene von verfehlten Würfen trennen. Obwohl das System noch Schwierigkeiten mit sehr ähnlichen Bewegungen hat und derzeit am besten auf leistungsstarken Rechnern läuft, weist die Studie auf eine Zukunft hin, in der Spieler aller Leistungsstufen sofortige, objektive Aufschlüsselungen ihrer Technik erhalten können. Praktisch bedeutet das gezielteres Training, weniger schlechte Gewohnheiten und einen klareren Weg von der Freiwurflinie zum Korb.
Zitation: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0
Schlüsselwörter: Basketball Freiwurf, Sportanalytik, Bewegungserfassung, Tiefes Lernen, Aktionserkennung