Clear Sky Science · pl

Zastosowanie LSTM-CNN w rozpoznawaniu ruchów narciarskich w technologii sztucznej inteligencji

2026-03-02 · Powrót do spisu

Inteligentniejsze treningi na stoku

Narciarze, trenerzy i kibice coraz częściej sięgają po wideo, aby zrozumieć, co dzieje się w ułamku sekundy podczas skrętu czy skoku. W rzeczywistości jednak bryzgi śniegu, drzewa, zmienne oświetlenie i zatłoczone stoki utrudniają komputerom niezawodne rozpoznawanie wykonywanych przez narciarza czynności. W artykule przedstawiono nowy system sztucznej inteligencji, który potrafi automatycznie odczytywać technikę narciarską z zwykłych nagrań z wysoką dokładnością, nawet w nieuporządkowanych warunkach zewnętrznych. Taka technologia mogłaby w przyszłości zasilać narzędzia do coachingu w czasie rzeczywistym, bezpieczniejszego treningu i bardziej wnikliwej analizy osiągów sportowych zimowych dyscyplin.

Dlaczego nauczanie komputerów, by „widziały” narty, jest trudne

Analiza narciarstwa jest wymagająca, ponieważ ruchy są szybkie, trójwymiarowe i często częściowo ukryte przez masywną odzież lub własne ciało narciarza. Równocześnie sceny plenerowe pełne są rozpraszaczy: drzew, muld śnieżnych, silnych refleksów i zmiennej pogody. Poprzednie systemy oparte na wideo albo zbytnio skupiały się na statycznym wyglądzie pojedynczych klatek, albo nie potrafiły właściwie śledzić, jak ruchy rozwijają się w czasie. W efekcie myliły podobne akcje, miały trudności przy słabej widoczności i nie były odporne na nowych zawodników czy odmienne warunki stoku.

Dwuelementowy obraz ruchu narciarskiego

Autorzy zaprojektowali model, który jednocześnie obserwuje nagrania narciarskie na dwa komplementarne sposoby. Jedno „oko” analizuje zwykłe kolorowe klatki, rejestrując wygląd narciarza i otoczenia. Drugie „oko” skupia się na ruchu, śledząc, jak piksele przemieszczają się między kolejnymi klatkami — technikę znaną jako przepływ optyczny. Z tego pola ruchu system buduje mapę istotności, która uwypukla rzeczywiście aktywne obszary — narty, nogi i tułów — jednocześnie marginalizując statyczne tło, takie jak drzewa czy skarpy śnieżne. Oba strumienie przechodzą przez trójwymiarową sieć konwolucyjną, która uczy się wzorców w przestrzeni i krótkich przedziałach czasowych, destylując każdy segment wideo do zwartego opisu wyglądu i ruchu.

Mieszanie tego, co widzi, i jak się porusza

Zamiast jedynie łączyć lub uśredniać oba strumienie informacji, model uczy się, jaką wagę przypisać każdemu z nich dla analizowanego klipu. Przy niektórych manewrach, na przykład hamowaniu pługiem, gdy narty tworzą charakterystyczny kształt, ważniejsze są wskazówki z wyglądu. Przy płynnych skrętach równoległych bardziej istotny jest rytm i kierunek ruchu. Uczenie się poprzez moduł fuzji automatycznie dostosowuje te wkłady, normalizując oba zbiory cech i łącząc je za pomocą trenowanych wag, które sumują się zawsze do jedności. Ta adaptacyjna mieszanka pozwala systemowi skupić się na tym dowodzie wizualnym, który jest najbardziej informatywny dla aktualnej akcji, co zwiększa dokładność i niezawodność rozpoznawania w różnorodnych stylach i sceneriach narciarskich.

Czytanie pełnej historii każdego skrętu

Rozpoznanie ruchu w narciarstwie to nie tylko pojedyncza poza; to sposób, w jaki sekwencja rozwija się od początku do końca. Aby to uchwycić, zintegrowane cechy są podawane do dwukierunkowej sieci rekurencyjnej, która patrzy zarówno w przód, jak i w tył w czasie. Zamiast polegać wyłącznie na poprzednich klatkach, model wykorzystuje także wskazówki z nadchodzących klatek, by lepiej zrozumieć, co wykonuje narciarz. Pomaga to odróżnić akcje, które w pojedynczym kadrze mogą wyglądać podobnie, ale różnią się czasowaniem i koordynacją. Testy na zbiorze SkiTB — dużej kolekcji rzeczywistych nagrań narciarskich — pokazują, że nowy system przewyższa kilka ustalonych metod, osiągając około 93% precyzji i F1. Utrzymuje ponad 85% dokładności nawet przy ocenie w różnych warunkach pogodowych, na nieznanych zawodnikach i w nagraniach z dodanym sztucznym szumem.

Co to oznacza dla narciarzy i technologii sportowej

Łącząc skoncentrowane postrzeganie ruchu, adaptacyjne łączenie wskazówek wizualnych i czasowo świadome odczytywanie ruchu, proponowany model potrafi niezawodnie rozpoznać, czy narciarz skręca, hamuje czy skacze, nawet w zagraconym i zmieniającym się otoczeniu. Dla osób niezwiązanych specjalistycznie z tematem kluczowe jest to, że system nie ogranicza się do zliczania klatek; uczy się, gdzie patrzeć, co jest najważniejsze i jak przebiega pełny cykl akcji. Podejście to może stanowić trzon inteligentnych asystentów treningowych, którzy dostarczają obiektywną informację zwrotną, pomagają zapobiegać kontuzjom poprzez wykrywanie ryzykownych wzorców i wspierają bogatszą analizę w transmisjach. Choć autorzy zauważają, że ekstremalna pogoda i bardzo krótkie sztuczki powietrzne nadal stanowią wyzwanie, ich ramy oferują solidną podstawę pod przyszłe narzędzia inteligentnego coachingu w narciarstwie i potencjalnie w wielu innych sportach plenerowych.

Cytowanie: Zhang, W., Xu, L. & Wang, L. Application of LSTM-CNN in skiing action recognition under artificial intelligence technology. Sci Rep 16, 11547 (2026). https://doi.org/10.1038/s41598-026-42324-2

Słowa kluczowe: rozpoznawanie ruchów narciarskich, analiza wideo sportowego, uczenie głębokie, przepływ optyczny, wydajność sportowca