Clear Sky Science · pl
PoseShot: hybrydowy model CNN–BiLSTM z transformatorem do rozpoznawania akcji rzutu wolnego poprzez analizę postawy
Inteligentniejszy trening klasycznego rzutu w koszykówce
Dla każdego, kto kiedykolwiek stanął na linii rzutów wolnych, granica między trafieniem na samym siatce a niecelnym rzutem może wydawać się tajemnicza. To badanie pokazuje, jak sztuczna inteligencja może zamienić tę tajemnicę w jasną, obiektywną informację zwrotną. Poprzez uważną analizę sylwetki zawodnika podczas rzutu wolnego, system badaczy, nazwany PoseShot, rozbija rzut na zrozumiałe etapy i ujawnia, które ruchy odróżniają solidną technikę od chwiejnej.

Rozbicie rzutu wolnego na klarowne fazy
Zamiast traktować rzut wolny jako pojedynczą, prostą akcję, PoseShot postrzega go jako sekwencję pięciu odrębnych faz: kozłowanie, zatrzymanie, podniesienie, rzut i follow-through. Zespół zebrał 75 filmów z zawodnikami wykonującymi rzuty wolne w różnych salach, przy różnych warunkach oświetleniowych i kątach kamery, a następnie oznaczył tysiące klatek tymi nazwami faz. To drobiazgowe podejście pozwala systemowi zadawać znacznie bardziej szczegółowe pytania: Czy zawodnik wystarczająco długo zatrzymuje się w fazie hold? Czy trajektoria ramienia podczas podniesienia jest płynna? Czy follow-through jest spójny między kolejnymi rzutami?
Odczytywanie ciała za pomocą widzenia komputerowego
Aby zobaczyć, co robi zawodnik, PoseShot łączy dwa uzupełniające się spojrzenia na ten sam ruch. Po pierwsze analizuje surowy materiał wideo i używa typu sieci neuronowej znanej jako sieć konwolucyjna, aby wychwycić kształty, położenia kończyn i wskazówki ruchowe w kolejnych klatkach. Po drugie uruchamia materiał przez narzędzie do estymacji pozy, które zaznacza 2D lokalizacje stawów na całym ciele. Z tych punktów oblicza osiem kluczowych kątów stawowych, obejmujących oba łokcie, biodra i kolana. Te kąty tworzą swego rodzaju numeryczny odcisk palca postawy zawodnika w czasie, pokazując jak energia przepływa od nóg, przez tułów, do ramienia wykonującego rzut.

Mieszanie dwóch strumieni inteligencji ruchu
Rdzeniem PoseShot jest architektura o dwóch ścieżkach, która równolegle przetwarza obraz i postawę. Strumień obrazu przepływa przez kilka warstw, które stopniowo kondensują szczegóły wizualne do zwartego wektora cech. Strumień postawy przekazuje sekwencję kątów stawowych do specjalnej sieci uwzględniającej czas, która śledzi, jak jedna pozycja ciała prowadzi do następnej, zarówno w przód, jak i w tył w czasie. Na obu strumieniach umieszczone są warstwy transformera działające jak mechanizmy uwagi, podkreślające najbardziej informacyjne momenty i relacje w ruchu. Na koniec obie ścieżki są scalane i trafiają do klasyfikatora, który decyduje, klatka po klatce, w której fazie rzutu wolnego znajduje się zawodnik.
Przewyższając innych wirtualnych trenerów
Aby ocenić skuteczność PoseShot, badacze porównali go z szeregiem popularnych modeli uczenia głębokiego — od klasycznych sieci obrazowych po nowoczesne projekty oparte na transformerach. Używając zrównoważonej miary nagradzającej zarówno trafienia, jak i unikanie błędów, PoseShot osiągnął około 96 na 100, wygrywając z wszystkimi konkurencyjnymi metodami ogólnie, a szczególnie wyróżniając się w kluczowej fazie rzutu. System był szczególnie skuteczny w rozpoznawaniu wyraźnych ruchów, takich jak hold, throw i follow-through. Najtrudniejsze rozróżnienia dotyczyły faz dribble i raise, które w rzeczywistej grze często płynnie się łączą i różnią się subtelnym timingiem i prędkością, a nie oczywistymi zmianami postawy.
Od danych do praktycznych wskazówek trenerskich
Przekształcając szybkie wideo i pomiary stawów w wiarygodne oznaczenia faz, PoseShot oferuje trenerom coś więcej niż tylko zapis wyróżnionych ujęć. Dostarcza uporządkowany sposób zobaczenia, gdzie forma zawodnika się załamuje, jak konsekwentnie powtarza kluczowe pozycje i które fragmenty ruchu oddzielają trafione rzuty od niecelnych. Chociaż system wciąż ma trudności z bardzo podobnymi ruchami i obecnie działa najlepiej na wydajnych komputerach, badanie wskazuje na przyszłość, w której zawodnicy na wszystkich poziomach będą mogli otrzymywać natychmiastowe, obiektywne analizy swojej techniki. W praktyce oznacza to bardziej ukierunkowany trening, mniej złych nawyków i jaśniejszą drogę od linii rzutów wolnych do obręczy.
Cytowanie: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0
Słowa kluczowe: rzut wolny w koszykówce, analiza sportowa, rejestracja ruchu, uczenie głębokie, rozpoznawanie akcji