Clear Sky Science · it

PoseShot: modello ibrido CNN–BiLSTM transformer per il riconoscimento dell’azione del tiro libero tramite analisi della postura

· Torna all'indice

Pratica più intelligente per un classico tiro del basket

Per chiunque si sia mai posizionato sulla linea del tiro libero, la differenza tra una retina e un errore può sembrare misteriosa. Questo studio mostra come l’intelligenza artificiale possa trasformare quel mistero in un feedback chiaro e oggettivo. Leggendo con cura la postura di un giocatore durante il tiro libero, il sistema dei ricercatori, chiamato PoseShot, suddivide il tiro in fasi comprensibili e rivela quali movimenti distinguono una tecnica solida da una incerta.

Figure 1
Figura 1.

Suddividere il tiro libero in fasi chiare

Invece di trattare il tiro libero come un’azione unica e semplice, PoseShot lo considera come una sequenza di cinque fasi distinte: palleggio, posizione, sollevamento, lancio e follow-through. Il team ha raccolto 75 video di giocatori che eseguivano tiri liberi in diverse palestre, condizioni di illuminazione e angolazioni della camera, quindi ha etichettato migliaia di fotogrammi con questi nomi di fase. Questo approccio dettagliato consente al sistema di porre domande molto più specifiche: il giocatore si ferma abbastanza a lungo nella fase di posizione? Il percorso del braccio è fluido durante il sollevamento? Il follow-through è coerente da un tiro all’altro?

Leggere il corpo con la visione artificiale

Per capire cosa sta facendo il giocatore, PoseShot combina due viste complementari dello stesso movimento. Innanzitutto analizza le immagini video grezze e utilizza un tipo di rete neurale nota come rete convoluzionale per catturare forme, posizioni degli arti e indizi di movimento in ciascun fotogramma. In secondo luogo esegue il video attraverso uno strumento di stima della posa che individua le posizioni 2D delle articolazioni in tutto il corpo. Da questi punti calcola otto angoli articolari chiave, compresi entrambi i gomiti, fianchi e ginocchia. Questi angoli formano una sorta di impronta numerica della postura del giocatore nel tempo, catturando come l’energia si trasferisce dalle gambe, attraverso il busto, al braccio di tiro.

Figure 2
Figura 2.

Fondere due flussi di intelligenza del movimento

Il cuore di PoseShot è un’architettura a doppio percorso che elabora immagini e postura fianco a fianco. Il flusso d’immagine passa attraverso diversi strati che condensano progressivamente i dettagli visivi in caratteristiche compatte. Il flusso di postura alimenta la sequenza di angoli articolari in una rete speciale sensibile al tempo che traccia come una posizione corporea conduce alla successiva, sia in avanti che all’indietro nel tempo. Soprattutto a entrambi i flussi, il sistema aggiunge strati transformer che agiscono come meccanismi di attenzione, evidenziando i momenti e le relazioni più informativi nel movimento. Infine, fonde i due flussi e li invia a un classificatore che decide, fotogramma per fotogramma, in quale fase del tiro libero si trova il giocatore.

Superare altri allenatori AI

Per valutare l’efficacia di PoseShot, i ricercatori lo hanno confrontato con una gamma di modelli di deep learning popolari, dalle reti immagini classiche ai moderni design basati su transformer. Utilizzando una metrica bilanciata che premia sia le corrette classificazioni sia l’evitamento degli errori, PoseShot ha ottenuto circa 96 su 100, superando tutti i metodi concorrenti nel complesso e distinguendosi in particolare nella cruciale fase di lancio. Il sistema è risultato particolarmente forte nel riconoscere movimenti netti come posizione, lancio e follow-through. Le distinzioni più difficili sono risultate quelle tra palleggio e sollevamento, che spesso si fondono l’una nell’altra nel gioco reale e differiscono per sottili tempistiche e velocità più che per evidenti cambiamenti posturali.

Dai dati a un coaching concreto

Trasformando video ad alta velocità e misure articolari in etichette di fase affidabili, PoseShot offre agli allenatori più di una semplice compilation di momenti salienti. Fornisce un metodo strutturato per vedere dove la forma di un giocatore si rompe, quanto coerentemente ripete posizioni chiave e quali parti del movimento separano i tiri riusciti dagli errori. Sebbene il sistema abbia ancora difficoltà con movimenti molto simili e attualmente funzioni al meglio su computer potenti, lo studio indica un futuro in cui giocatori di tutti i livelli possono ricevere analisi istantanee e oggettive della loro tecnica. In termini pratici, ciò significa allenamenti più mirati, meno cattive abitudini e un percorso più chiaro dalla linea del tiro libero al fondo della retina.

Citazione: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0

Parole chiave: tiro libero di basket, analitica sportiva, motion capture, deep learning, riconoscimento delle azioni