Clear Sky Science · nl

Beoordeling van atleetactiekwaliteit op basis van overdrachts-neuraalnetwerk scoreontkoppeling in complexe sportscenario's

2026-04-02 · Terug naar het overzicht

Waarom slimmer wedstrijdjureren ertoe doet

Van olympisch duiken tot breakdance-battles: veel sporten zijn afhankelijk van menselijke jury's die complexe bewegingen terugbrengen tot één score. Maar lange uitvoeringen zijn ongelijkmatig: sommige momenten zijn spectaculair, andere onzeker of gewoon opvulling. Deze studie onderzoekt hoe kunstmatige intelligentie hele video's van complexe uitvoeringen kan bekijken, de écht belangrijke momenten kan selecteren en consistentere, fijnmazigere scores kan produceren die jury's, coaches, artsen en gewone leerlingen ondersteunen.

De hele show bekijken, niet alleen de hoogtepunten

Traditionele computersystemen die atletische prestaties beoordelen behandelen een volledige video vaak alsof elke seconde even belangrijk is. Die veronderstelling faalt bij echte optredens. Bij breakdance, bijvoorbeeld, wegen vroege passen die bij de muziek passen vaak minder zwaar dan moeilijke moves op de grond, freezes of krachtige spins later in de routine. Bestaande methoden vlakken vaak alles samen, waardoor zowel briljante bewegingen als kritieke fouten worden verhuld. De auteurs beschouwen dit als een algemeen probleem in lange vaardigheidsvideo's: kwaliteit varieert in de tijd en positieve en negatieve aanwijzingen kunnen in dezelfde uitvoering voorkomen. Hun doel is een systeem te bouwen dat de sleutelmomenten van achtergrondbeweging scheidt, waardoor het eenvoudiger wordt om te vergelijken hoe goed twee mensen daadwerkelijk presteerden.

Figure 1. AI scheidt beweging en houding in lange sport- en vaardigheidsvideo's om een totale kwaliteitscore te geven.

Twee manieren om naar dezelfde uitvoering te kijken

Het voorgestelde model bekijkt elke video via twee afzonderlijke lenzen. De ene “dynamische” stroom richt zich op beweging in de tijd met korte clips en legt ritme, flow en continuïteit vast. De andere “statistische” stroom onderzoekt afzonderlijke frames en pikt houding, lichaamscontrole en kleine vormfouten op die slechts even zichtbaar zijn. Cruciaal is dat deze stromen niet vroeg worden gemengd. Elk leert eerst zijn eigen kijk op de uitvoering, wat voorkomt dat korte houdingsfouten worden weggedrukt door lange soepele sequenties of andersom. Pas nadat elke stroom zijn kwaliteitsbewuste kenmerken heeft gevormd, worden ze gecombineerd om een totaalscore te schatten.

Sterke bewegingen scheiden van zwakke

Centraal in het systeem staat een "score-ontkoppelings"-module die expliciet videosegmenten scheidt die sterke aanwijzingen van vaardigheid laten zien van segmenten die zwakkere of gebrekkige uitvoering suggereren. Geïnspireerd door moderne aandachtgebaseerde netwerken leert het model twee interne "prototypes": één die op zoek gaat naar hoogwaardige momenten en één die zich richt op lage-kwaliteit momenten. Terwijl de video wordt verwerkt, kent elke prototype verschillende gewichten toe aan segmenten, waardoor twee complementaire samenvattingen ontstaan: één opgebouwd uit de beste clips en één uit de slechtste of minst bruikbare clips. Een eenvoudige tijdsgemiddelde wordt ook bewaard als neutrale basislijn. Speciale trainingsregels duwen de hoge- en lage-kwaliteitsvisies ertoe op nuttige manieren van mening te verschillen en zich op verschillende delen van de video te concentreren, in plaats van op dezelfde voor de hand liggende frames te klonteren.

Figure 2. AI markeert de beste en slechtste momenten in een lange uitvoering voordat deze worden samengevoegd tot één kwaliteitscore.

Leren rangschikken van uitvoeringen door paren te bekijken

In plaats van te vertrouwen op precieze numerieke scores van menselijke experts, wordt het systeem voornamelijk getraind op pairwise vergelijkingen: gegeven twee video's, welke performer toonde over het geheel genomen betere vaardigheid? Voor elk paar voorspelt het model scores voor hun hoge-kwaliteit-, lage-kwaliteit- en gemiddelde takken en wordt het bestraft als de rangorde fout is of als de gescheiden takken niet discriminerender blijken dan het eenvoudige gemiddelde. Aanvullende trainingscomponenten stimuleren de "goede" en "slechte" visies om andere tijdsegmenten te benadrukken. Nadat de training is voltooid, kan het systeem een enkele nieuwe video bekijken en één stabiele kwaliteitscore uitgeven, zonder dat er een referentievideo naast hoeft te staan.

Van breakdance-battles tot chirurgie en alledaagse vaardigheden

Om hun aanpak te testen bouwden de auteurs een nieuwe dataset van wereldklasse breakdance-battles en evalueerden ze de methode ook op twee bestaande collecties van lange vaardigheidsvideo's: alledaagse taken zoals tekenen, koken en een stropdas knopen, en chirurgische en fijnmotorische activiteiten. In deze uiteenlopende omgevingen kwam hun model doorgaans overeen met of overtrof het de nauwkeurigheid van toonaangevende methoden bij het bepalen welke van twee video's een hogere vaardigheid toont. Visualisaties van de interne aandachtkaarten laten zien dat hoge-kwaliteits-takken de neiging hebben op te lichten rond goed gecontroleerde, technisch veeleisende bewegingen, terwijl lage-kwaliteits-takken ongemakkelijke overgangen of onvoltooide acties benadrukken. Voor de lekenlezer is de kernboodschap dat dit systeem computers leert niet alleen te herkennen welke actie plaatsvindt, maar hoe goed deze wordt uitgevoerd, door zorgvuldig de beste en slechtste delen van een uitvoering te scheiden voordat ze worden samengevoegd tot een uiteindelijke, interpreteerbare score.

Bronvermelding: Gao, L., Ma, Y., Bi, S. et al. Athlete action quality assessment based on transfer neural network quality score decoupling in complex sports scenarios. Sci Rep 16, 15795 (2026). https://doi.org/10.1038/s41598-026-43987-7

Trefwoorden: actiekwaliteitsbeoordeling, sportvideo-analyse, breakdance, aandachtsgebaseerde modellen, vaardigheidsbeoordeling