Clear Sky Science · nl

Toepassing van LSTM-CNN bij herkenning van skibewegingen onder kunstmatige-intelligentie-technologie

· Terug naar het overzicht

Slimmer coachen op de piste

Skiërs, coaches en fans wenden zich steeds vaker tot video om te begrijpen wat er in een fractie van een seconde gebeurt bij een carve of sprong. In de praktijk maken sneeuwspatten, bomen, wisselend licht en drukke pistes het echter moeilijk voor computers om betrouwbaar te herkennen wat een skiër doet. Dit artikel presenteert een nieuw kunstmatige-intelligentiesysteem dat techniek van het skiën automatisch uit gewone video’s kan aflezen met hoge nauwkeurigheid, zelfs onder rommelige buitensituaties. Zulke technologie zou ooit real-time coachingttools, veiliger training en diepgaandere prestatieanalyse voor wintersporten mogelijk kunnen maken.

Waarom het lastig is om computers skiën te leren zien

Analyseren van skiën is veeleisend omdat de bewegingen snel, driedimensionaal en vaak gedeeltelijk verborgen zijn door omvangrijke kleding of het eigen lichaam van de skiër. Tegelijkertijd zit de buitenomgeving vol afleidingen: bomen, sneeuwhopen, sterke reflecties en wisselvallig weer. Eerdere op video-gebaseerde systemen legden te veel nadruk op statische verschijning in afzonderlijke frames of slaagden er niet in juist te volgen hoe bewegingen zich over tijd ontvouwen. Daardoor raakten ze soortgelijke acties vaak in de war, worstelden ze bij slechte zichtbaarheid en waren ze niet robuust wanneer nieuwe atleten of andere pistecondities opdoken.

Figure 1
Figure 1.

Een tweezijdige blik op skibewegingen

De auteurs ontwerpen een model dat skivideo’s op twee complementaire manieren tegelijk bekijkt. Het ene “oog” kijkt naar gewone kleurframes en legt vast hoe de skiër en de omgeving eruitzien. Het andere “oog” focust op beweging door te volgen hoe pixels verschuiven van het ene frame naar het volgende, een techniek die bekendstaat als optische stroming. Uit dit bewegingsveld bouwt het systeem een salientiekaart die de werkelijk actieve regio’s — de ski’s, benen en romp — benadrukt en statische achtergrond zoals bomen en sneeuwbanken minder belangrijk maakt. Beide stromen gaan door een 3D-convolutienetwerk dat patronen leert over ruimte en korte tijdsintervallen en elk videosegment distilleert tot compacte signaturen van verschijning en beweging.

Het mengen van wat het ziet en hoe het beweegt

In plaats van de twee informatiestromen simpelweg te stapelen of te middelen, leert het model hoeveel gewicht het aan elk van beide moet geven voor elke clip die het analyseert. Voor sommige manoeuvres, zoals een ploegrem waarbij de ski’s een kenmerkende vorm vormen, zijn verschijningscues belangrijker. Voor vloeiende parallelle bochten zijn het ritme en de richting van de beweging meer sprekend. Een leerbare fusiemodule past deze bijdragen automatisch aan, normaliseert de twee feature-sets en combineert ze via getrainde gewichten die samen altijd één vormen. Deze adaptieve mix stelt het systeem in staat zich te concentreren op het visuele bewijs dat voor de huidige actie het meest informatief is, waardoor herkenning nauwkeuriger en betrouwbaarder wordt bij uiteenlopende skistijlen en scènes.

Figure 2
Figure 2.

Het volledige verhaal van elke bocht lezen

Een actie herkennen bij skiën gaat niet alleen over een enkele houding; het gaat over hoe een sequentie zich van begin tot eind ontvouwt. Om dat vast te leggen, worden de gefuseerde features gevoed aan een bidirectioneel recurrent netwerk dat zowel vooruit als achteruit in de tijd kijkt. In plaats van alleen op eerdere frames te vertrouwen, gebruikt het model ook aanwijzingen uit komende frames om te begrijpen wat de skiër doet. Dit helpt het onderscheid te maken tussen acties die op een momentopname vergelijkbaar lijken maar verschillen in timing en coördinatie. Tests op de SkiTB-dataset — een grote verzameling real-world skivideo’s — tonen aan dat het nieuwe systeem meerdere gevestigde methoden verslaat en ongeveer 93% precisie en F1-score behaalt. Het blijft boven de 85% nauwkeurigheid, zelfs wanneer het wordt geëvalueerd onder andere weersomstandigheden, onbekende atleten en video’s met kunstmatig toegevoegde ruis.

Wat dit betekent voor skiërs en sporttech

Door gerichte bewegingswaarneming, adaptief mengen van visuele aanwijzingen en een tijdsbewuste lezing van beweging te combineren, kan het voorgestelde model betrouwbaar vaststellen of een skiër draait, remt of springt, zelfs in rommelige en veranderende omgevingen. Voor niet-specialisten is de belangrijkste conclusie dat het systeem niet alleen frames telt; het leert waar het moet kijken, wat het meest telt en hoe een volledige actiescyclus zich ontvouwt. Deze aanpak kan de ruggengraat vormen van intelligente trainingsassistenten die objectieve feedback geven, helpen blessures te voorkomen door risicovolle patronen te signaleren en rijkere analyses voor uitzendingen ondersteunen. Hoewel de auteurs opmerken dat extreem weer en zeer korte luchttrucs nog uitdagingen blijven, biedt hun raamwerk een robuuste basis voor toekomstige slimme coachingshulpmiddelen in het skiën en mogelijk veel andere buitensporten.

Bronvermelding: Zhang, W., Xu, L. & Wang, L. Application of LSTM-CNN in skiing action recognition under artificial intelligence technology. Sci Rep 16, 11547 (2026). https://doi.org/10.1038/s41598-026-42324-2

Trefwoorden: herkenning van skibewegingen, analyse van sportvideo's, deep learning, optische stroming, prestatie van atleten