Clear Sky Science · pl
Zastosowanie algorytmu PoseConv3D w rozpoznawaniu ruchów podczas treningu cheerleadingu
Inteligentniejsze trenerstwo dla szybkiego sportu
Współczesny cheerleading to znacznie więcej niż doping z linii bocznej; to wymagający, akrobatyczny sport zespołowy, w którym drobne błędy w synchronizacji lub postawie mogą przesądzić o czystym wykonaniu lub groźnym upadku. Mimo to większość treningów wciąż opiera się na oku trenera i powtórkach wideo. W artykule przedstawiono system sztucznej inteligencji, który potrafi analizować układy cheerleadersów klatka po klatce, rozumieć pozycje ciała i automatycznie rozpoznawać wykonywane elementy oraz ich stopień trudności, otwierając drogę do bezpieczniejszego, precyzyjnego i spersonalizowanego treningu.

Dlaczego cheerleading stanowi szczególne wyzwanie
Wiele sportów i codziennych czynności zostało już zbadanych za pomocą widzenia komputerowego, lecz cheerleading wystawia istniejące metody na próbę. Zawodnicy obracają się kilka razy na sekundę, wykonują salta w powietrzu i budują wieloosobowe piramidy, gdzie ciała nachodzą na siebie i zasłaniają widok kamery. Ruchy, które w przestrzeni wyglądają podobnie — na przykład falowanie ramion i wysokie kopnięcia — mogą różnić się głównie rytmem, czego standardowe algorytmy w dużej mierze nie uwzględniają. W efekcie popularne systemy rozpoznawania akcji źle odczytują pozycje kluczowych stawów, gubią śledzenie osób w grupowych ewolucjach i mylą ruchy o podobnych trajektoriach, co prowadzi do niskiej dokładności i zawodnych wskazówek na prawdziwych treningach.
Przekształcanie wideo w czyste cyfrowe szkielety
Nowy system opiera się na trójwymiarowej sieci konwolucyjnej opartej na pozach, nazwanej PoseConv3D, która działa nie na surowych pikselach, lecz na uproszczonych „patyczkowych” szkielecikach wyekstrahowanych z wideo. Pierwszą innowacją jest dynamiczny etap korekcji, który oczyszcza te szkielety. Gdy detektor pozy ma wątpliwości co do położenia stawu — na przykład nadgarstka rozmytego podczas obrotu — system przewiduje jego najprawdopodobniejszą ścieżkę w czasie, używając gładkich krzywych zgodnych z ruchem sąsiednich klatek. Redukuje to drżenie i dryf pozycji stawów o ponad 40%, dając algorytmowi uczącemu znacznie jaśniejszy obraz rzeczywistych ruchów ciała zawodnika podczas szybkich rotacji i przejść powietrznych.
Widzenie zarówno drobnych detali, jak i dużych zespołowych wzorców
Po oczyszczeniu szkieletów system analizuje ruch w kilku skalach jednocześnie. Jeden strumień przetwarzania koncentruje się na drobnych detalach, takich jak szybkie pstrykniecie nadgarstka czy wybicie ze stopy, podczas gdy inny obserwuje szersze wzorce — na przykład łuk nogi czy skoordynowany wzrost kilku zawodników przy unoszeniu. Poprzez łączenie tych perspektyw model lepiej rozumie, jak niewielkie korekty składają się na duże, zespołowe formacje. Testy na dedykowanym zbiorze danych University of Central Florida — ponad 500 klipów treningowych i konkursowych w wysokiej rozdzielczości z precyzyjnie oznaczonymi ruchami i poziomami trudności — pokazują, że takie podejście wieloskalowe istotnie poprawia rozpoznawanie złożonych, wysoko skoordynowanych ewolucji.

Nauczanie systemu rozpoznawania rytmu
Wyjątkową cechą pracy jest to, że algorytm nie tylko obserwuje, jak zawodnicy poruszają się w przestrzeni; uczy się również, kiedy się poruszają. Badacze obliczają, jak szybko każdy staw przesuwa się między klatkami i przekształcają te zmiany w wzory rytmiczne, podobnie jak przekształca się muzykę w spektrum uderzeń. Specjalny moduł uwagi następnie podkreśla momenty w sekwencji ruchu, które odpowiadają kluczowym sygnaturom rytmicznym. Dzięki temu system potrafi wiarygodnie rozróżniać akcje, które opisują niemal identyczne trajektorie, ale rozwijają się w różnych tempach, zmniejszając mylenie falistych ruchów z zsynchronizowanymi kopnięciami z około jednego na sześć przypadków do zaledwie kilku na sto.
Od rozpoznawania do treningowego partnera w czasie rzeczywistym
Na końcu potoku system generuje jednocześnie dwa wyniki: rodzaj wykonywanego elementu cheerleadingowego oraz szacowaną ocenę trudności zgodną z zasadami konkursowymi. Działając z prędkością bliską 90 klatkom na sekundę, komfortowo przekracza szybkość wymaganą do informacji zwrotnej w czasie rzeczywistym. Dokładność ogólna sięga około 93%, przewyższając kilka najnowocześniejszych metod z znaczącą przewagą. Dla zawodników i trenerów oznacza to zautomatyzowanego asystenta, który może na bieżąco wskazywać spóźnione falowania, niestabilne lądowania czy luki w synchronizacji zespołu, jednocześnie śledząc postępy w coraz trudniejszych umiejętnościach — co stanowi istotny krok ku treningowi cheerleadingu opartego na danych, bezpieczniejszemu i bardziej dopracowanemu.
Cytowanie: Li, Q. Application of PoseConv3D algorithm in cheerleading training action recognition. Sci Rep 16, 12265 (2026). https://doi.org/10.1038/s41598-026-43019-4
Słowa kluczowe: cheerleading, rozpoznawanie ruchu, estymacja pozy, analityka sportowa, uczenie głębokie