Clear Sky Science · sv

PoseShot: hybrid CNN–BiLSTM-transformermodell för igenkänning av straffkast via posesanalys

· Tillbaka till index

Smartare träning för ett klassiskt baskethäls

För den som någonsin stått vid straffkastlinjen kan skillnaden mellan ett swish och ett miss kännas mystisk. Denna studie visar hur artificiell intelligens kan förvandla den mystiken till tydlig, objektiv återkoppling. Genom att noggrant avläsa en spelares kroppshållning under ett straffkast delar forskarnas system, kallat PoseShot, upp kastet i begripliga skeden och avslöjar vilka rörelser som skiljer en stabil teknik från en osäker.

Figure 1
Figure 1.

Att dela upp ett straffkast i tydliga faser

I stället för att betrakta ett straffkast som en enda, enkel handling ser PoseShot det som en sekvens av fem distinkta faser: studs, håll, lyft, kast och följa igenom. Teamet samlade 75 videor av spelare som utförde straffkast i olika hallar, ljusförhållanden och kameravinklar, och märkte därefter tusentals bildrutor med dessa fasnamn. Detta finslipade tillvägagångssätt gör det möjligt för systemet att ställa mycket mer specifika frågor: Pausar spelaren tillräckligt länge i håll-fasen? Är armens bana jämn under lyftet? Är följa-igenom konsekvent från kast till kast?

Läsa kroppen med datorseende

För att se vad spelaren gör kombinerar PoseShot två kompletterande vyer av samma rörelse. Först analyserar det de råa videobilderna och använder en typ av neuralt nätverk känt som ett konvolutionsnätverk för att fånga former, lemmars positioner och rörelsekännetecken i varje bildruta. För det andra körs videon genom ett pose-estimeringsverktyg som markerar 2D-ledpositioner över hela kroppen. Från dessa punkter beräknas åtta viktiga ledvinklar, inklusive båda armbågarna, höfterna och knäna. Dessa vinklar bildar en slags numeriskt fingeravtryck av spelarens hållning över tid och fångar hur energi förs från benen, genom bålen, till skjutararmen.

Figure 2
Figure 2.

Att blanda två strömmar av rörelseintelligens

Kärnan i PoseShot är en tvåvägsarkitektur som bearbetar bilder och hållning sida vid sida. Bildströmmen går genom flera lager som gradvis kondenserar visuella detaljer till kompakta kännetecken. Hållningsströmmen matar sekvensen av ledvinklar in i ett särskilt tidsmedvetet nätverk som spårar hur en kroppsställning leder till nästa, både framåt och bakåt i tiden. Ovanpå båda strömmarna lägger systemet till transformerlager som fungerar som uppmärksamhetsmekanismer och lyfter fram de mest informativa ögonblicken och relationerna i rörelsen. Slutligen slås de två strömmarna samman och skickas in i en klassificerare som avgör, ruta för ruta, i vilken fas av straffkastet spelaren befinner sig.

Slår andra AI-tränare

För att bedöma hur väl PoseShot fungerar jämförde forskarna det med en rad populära djuplärande-modeller, från klassiska bildnätverk till moderna transformerbaserade konstruktioner. Med en balanserad metrik som belönar både träffsäkerhet och att undvika fel nådde PoseShot cirka 96 av 100, vilket slog alla konkurrerande metoder totalt sett och särskilt utmärkte sig i den avgörande kastfasen. Systemet var särskilt starkt på att känna igen tydliga rörelser som håll, kast och följa igenom. De svåraste skillnaderna var mellan studs och lyft, som ofta flyter ihop i verkligt spel och skiljer sig i subtil timing och hastighet snarare än i uppenbara hållningsförändringar.

Från data till åtgärdsinriktad coaching

Genom att omvandla högupplöst video och ledmätningar till pålitliga fasetiketter erbjuder PoseShot tränare mer än bara ett highlight-klipp. Det tillhandahåller ett strukturerat sätt att se var en spelares form fallerar, hur konsekvent de upprepar nyckelpositioner och vilka delar av rörelsen som skiljer gjorda skott från missar. Även om systemet fortfarande har svårt med mycket lika rörelser och för närvarande fungerar bäst på kraftfulla datorer, pekar studien mot en framtid där spelare på alla nivåer kan få omedelbara, objektiva genomgångar av sin teknik. I praktiska termer betyder det mer målinriktad träning, färre dåliga vanor och en tydligare väg från straffkastlinjen till nätets botten.

Citering: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0

Nyckelord: basketboll straffkast, sportanalys, rörelsefångst, djuplärande, aktionsigenkänning