Clear Sky Science · fr

PoseShot : modèle hybride CNN–BiLSTM transformeur pour la reconnaissance d’action au lancer franc via l’analyse de la posture

· Retour à l’index

Un entraînement plus intelligent pour un geste classique du basket

Pour quiconque s’est déjà placé sur la ligne des lancers francs, la différence entre un panier parfait et une tentative ratée peut sembler mystérieuse. Cette étude montre comment l’intelligence artificielle peut transformer ce mystère en retours clairs et objectifs. En lisant attentivement la posture du joueur pendant le lancer franc, le système des chercheurs, appelé PoseShot, décompose le geste en étapes compréhensibles et révèle quels mouvements distinguent une technique solide d’une technique hésitante.

Figure 1
Figure 1.

Décomposer un lancer franc en étapes claires

Plutôt que de traiter le lancer franc comme une action unique et simple, PoseShot le considère comme une séquence de cinq phases distinctes : dribble, maintien, élévation, lancer et suivi. L’équipe a collecté 75 vidéos de joueurs effectuant des lancers francs dans divers gymnases, conditions d’éclairage et angles de caméra, puis a étiqueté des milliers d’images avec ces noms de phase. Cette approche fine permet au système de poser des questions beaucoup plus précises : le joueur marque-t-il suffisamment de pause dans la phase de maintien ? La trajectoire du bras est-elle fluide pendant l’élévation ? Le suivi est-il cohérent d’un tir à l’autre ?

Lire le corps avec la vision par ordinateur

Pour voir ce que fait le joueur, PoseShot combine deux vues complémentaires d’un même mouvement. D’abord, il analyse les images brutes de la vidéo et utilise un type de réseau de neurones connu sous le nom de réseau convolutionnel pour capter les formes, les positions des membres et les indices de mouvement dans chaque image. Ensuite, il fait passer la vidéo par un outil d’estimation de pose qui repère les positions 2D des articulations sur tout le corps. À partir de ces points, il calcule huit angles articulaires clés, incluant les deux coudes, les hanches et les genoux. Ces angles forment une sorte d’empreinte numérique de la posture du joueur au fil du temps, capturant la façon dont l’énergie se transmet des jambes, via le torse, jusqu’au bras de tir.

Figure 2
Figure 2.

Fusionner deux flux d’intelligence du mouvement

Le cœur de PoseShot est une architecture à double voie qui traite l’image et la posture côte à côte. Le flux d’images traverse plusieurs couches qui condensent progressivement les détails visuels en caractéristiques compactes. Le flux de posture alimente la séquence d’angles articulaires dans un réseau temporel spécialisé qui suit comment une position du corps mène à la suivante, à la fois vers l’avant et vers l’arrière dans le temps. Au-dessus des deux flux, le système ajoute des couches de transformeur qui jouent le rôle de mécanismes d’attention, mettant en évidence les instants et les relations les plus informatifs du mouvement. Enfin, il fusionne les deux flux et les envoie dans un classifieur qui décide, image par image, de la phase du lancer franc dans laquelle se trouve le joueur.

Surpasser d’autres coachs IA

Pour évaluer les performances de PoseShot, les chercheurs l’ont comparé à une gamme de modèles d’apprentissage profond populaires, depuis les réseaux d’images classiques jusqu’aux architectures modernes basées sur les transformeurs. En utilisant une métrique équilibrée qui récompense à la fois la précision et l’évitement des erreurs, PoseShot a obtenu environ 96 sur 100, surpassant toutes les méthodes concurrentes dans l’ensemble et excellant particulièrement lors de la phase cruciale du lancer. Le système était notamment performant pour reconnaître des mouvements bien délimités comme le maintien, le lancer et le suivi. Les distinctions les plus difficiles concernaient le dribble et l’élévation, qui se confondent souvent dans le jeu réel et diffèrent par des subtilités de timing et de vitesse plutôt que par des changements de posture évidents.

Des données à un coaching exploitable

En transformant la vidéo à haute vitesse et les mesures articulaires en étiquettes de phase fiables, PoseShot offre aux entraîneurs plus qu’un simple montage de temps forts. Il fournit une méthode structurée pour voir où la technique d’un joueur se dégrade, à quel point il répète de façon cohérente des positions clés, et quelles parties du geste distinguent les tirs réussis des ratés. Bien que le système peine encore avec des mouvements très similaires et fonctionne actuellement mieux sur des machines puissantes, l’étude ouvre la voie à un avenir où des joueurs de tous niveaux pourront recevoir des analyses instantanées et objectives de leur technique. Concrètement, cela signifie des entraînements plus ciblés, moins de mauvaises habitudes et un chemin plus clair de la ligne des lancers francs vers le fond du filet.

Citation: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0

Mots-clés: lancer franc au basket, analytique sportive, capture de mouvement, apprentissage profond, reconnaissance d’action