Clear Sky Science · nl
PoseShot: hybride CNN–BiLSTM-transformermodel voor vrije worp actierkenning via pose-analyse
Slimmer oefenen voor een klassieke basketbalworp
Voor wie ooit op de vrije worplijn heeft gestaan, kan het verschil tussen een swish en een misser mysterieus aanvoelen. Deze studie toont hoe kunstmatige intelligentie dat mysterie kan omzetten in duidelijke, objectieve feedback. Door zorgvuldig de lichaamshouding van een speler tijdens een vrije worp te analyseren, splitst het systeem van de onderzoekers, PoseShot genoemd, de worp in begrijpelijke fasen en laat zien welke bewegingen een solide techniek scheiden van een wankele.

Een vrije worp opdelen in duidelijke fasen
In plaats van een vrije worp als één eenvoudige handeling te behandelen, ziet PoseShot die als een reeks van vijf afzonderlijke fases: dribble, hold, raise, throw en follow-through. Het team verzamelde 75 video’s van spelers die vrije worpen uitvoerden in verschillende gymzalen, lichtomstandigheden en camerahoeken, en labelde vervolgens duizenden frames met deze fasenamen. Deze fijnmazige aanpak stelt het systeem in staat veel specifieker te vragen: pauzeert de speler lang genoeg in de hold-fase? Lijkt het armenparcours tijdens de raise vloeiend? Is de follow-through consistent van worp tot worp?
Het lichaam lezen met computer vision
Om te zien wat de speler doet, combineert PoseShot twee aanvullende gezichtspunten op dezelfde beweging. Ten eerste bekijkt het de ruwe videobeelden en gebruikt een type neuraal netwerk dat bekendstaat als een convolutioneel netwerk om vormen, ledemaatposities en bewegingssignalen in elk frame vast te leggen. Ten tweede laat het de video door een pose-estimatieinstrument lopen dat 2D-gewrichtslocaties over het hele lichaam markeert. Uit deze punten berekent het acht belangrijke gewrichtshoeken, waaronder beide ellebogen, heupen en knieën. Deze hoeken vormen een soort numeriek vingerafdruk van de houding van de speler in de tijd, en vatten samen hoe energie van de benen via de romp naar de schietarm gaat.

Twee stromen van bewegingsintelligentie mengen
Het hart van PoseShot is een architectuur met twee paden die beelden en houding zij aan zij verwerkt. De beeldenstroom loopt door meerdere lagen die visuele details geleidelijk samenvatten tot compacte kenmerken. De houdingsstroom voert de opeenvolging van gewrichtshoeken in een speciaal tijdsbewust netwerk dat bijhoudt hoe de ene lichaamshouding in de tijd leidt tot de volgende, zowel vooruit als achteruit. Bovenop beide stromen voegt het systeem transformerlagen toe die fungeren als aandachtmechanismen en de meest informatieve momenten en relaties in de beweging benadrukken. Ten slotte voegt het de twee stromen samen en voert ze naar een classifier die frame voor frame bepaalt in welke fase van de vrije worp de speler zich bevindt.
Beter dan andere AI-coaches
Om te beoordelen hoe goed PoseShot werkt, vergeleken de onderzoekers het met een reeks populaire deep-learningmodellen, van klassieke beeldnetwerken tot moderne transformer-gebaseerde ontwerpen. Met een gebalanceerde metriek die zowel nauwkeurige treffers belooft als het vermijden van fouten beloont, scoorde PoseShot ongeveer 96 van de 100, waarmee het alle concurrerende methoden in het algemeen versloeg en vooral uitblonk in de cruciale throw-fase. Het systeem was bijzonder sterk in het herkennen van duidelijk te onderscheiden bewegingen zoals hold, throw en follow-through. De moeilijkste onderscheidingen lagen tussen dribble en raise, die in echt spel vaak in elkaar overlopen en verschillen in subtiele timing en snelheid in plaats van in duidelijke houdingveranderingen.
Van data naar bruikbare coaching
Door high-speed video en gewrichtsmetingen om te zetten in betrouwbare faselabels, biedt PoseShot coaches meer dan alleen een compilatie van hoogtepunten. Het levert een gestructureerde manier om te zien waar de vorm van een speler instort, hoe consistent zij sleutelposities herhalen en welke onderdelen van de beweging gemiste worpen van gemaakte scheiden. Hoewel het systeem nog moeite heeft met zeer vergelijkbare bewegingen en momenteel het beste werkt op krachtige computers, wijst de studie op een toekomst waarin spelers op alle niveaus onmiddellijke, objectieve ontledingen van hun techniek kunnen ontvangen. In praktische termen betekent dat gerichter oefenen, minder slechte gewoonten en een duidelijker pad van de vrije worplijn naar de ring.
Bronvermelding: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0
Trefwoorden: basketbal vrije worp, sportanalyses, bewegingsregistratie, deep learning, actierkenning