Clear Sky Science · es

PoseShot: modelo híbrido CNN–BiLSTM transformador para el reconocimiento de la acción de tiro libre mediante análisis de la pose

· Volver al índice

Práctica más inteligente para un tiro clásico de baloncesto

Para quienquiera que haya pisado la línea de tiros libres, la diferencia entre un aro limpio y un fallo puede parecer misteriosa. Este estudio muestra cómo la inteligencia artificial puede convertir ese misterio en retroalimentación clara y objetiva. Al leer cuidadosamente la postura del jugador durante un tiro libre, el sistema de los investigadores, llamado PoseShot, descompone el tiro en etapas comprensibles y revela qué movimientos separan una técnica sólida de una inestable.

Figure 1
Figure 1.

Dividir un tiro libre en etapas claras

En lugar de tratar el tiro libre como una acción única y simple, PoseShot lo considera como una secuencia de cinco fases distintas: bote, pausa, elevación, lanzamiento y seguimiento. El equipo recopiló 75 vídeos de jugadores realizando tiros libres en una variedad de gimnasios, condiciones de iluminación y ángulos de cámara, y etiquetó miles de fotogramas con estos nombres de fase. Este enfoque de detalle fino permite al sistema plantear preguntas mucho más específicas: ¿el jugador se detiene el tiempo suficiente en la fase de pausa? ¿La trayectoria del brazo se ve suave durante la elevación? ¿El seguimiento es consistente entre tiros?

Leer el cuerpo con visión por computadora

Para ver lo que hace el jugador, PoseShot combina dos visiones complementarias del mismo movimiento. Primero, analiza las imágenes en bruto del vídeo y utiliza un tipo de red neuronal conocida como red convolucional para capturar formas, posiciones de las extremidades y señales de movimiento en cada fotograma. En segundo lugar, procesa el vídeo con una herramienta de estimación de pose que marca las ubicaciones 2D de las articulaciones por todo el cuerpo. A partir de esos puntos calcula ocho ángulos articulares clave, incluidos ambos codos, caderas y rodillas. Estos ángulos forman una especie de huella numérica de la postura del jugador a lo largo del tiempo, captando cómo la energía viaja desde las piernas, a través del torso, hasta el brazo de tiro.

Figure 2
Figure 2.

Mezclando dos flujos de inteligencia del movimiento

El corazón de PoseShot es una arquitectura de doble vía que procesa imagen y postura en paralelo. El flujo de imágenes pasa por varias capas que condensan gradualmente los detalles visuales en características compactas. El flujo de postura alimenta la secuencia de ángulos articulares a una red especial con conciencia temporal que sigue cómo una posición corporal conduce a la siguiente, tanto hacia adelante como hacia atrás en el tiempo. Encima de ambos flujos, el sistema añade capas transformadoras que actúan como mecanismos de atención, destacando los momentos y las relaciones más informativos del movimiento. Finalmente, fusiona los dos flujos y los envía a un clasificador que decide, fotograma a fotograma, en qué fase del tiro libre se encuentra el jugador.

Superando a otros entrenadores de IA

Para evaluar el rendimiento de PoseShot, los investigadores lo compararon con una variedad de modelos populares de aprendizaje profundo, desde redes clásicas de imágenes hasta diseños modernos basados en transformadores. Usando una métrica equilibrada que premia tanto los aciertos como evitar errores, PoseShot obtuvo alrededor de 96 sobre 100, superando a todos los métodos competidores en conjunto y destacando especialmente en la crucial fase de lanzamiento. El sistema fue particularmente fuerte reconociendo movimientos claramente definidos como pausa, lanzamiento y seguimiento. Las distinciones más difíciles fueron entre bote y elevación, que a menudo se combinan en el juego real y difieren en sincronía y velocidad sutiles más que en cambios posturales evidentes.

De los datos a la formación accionable

Al convertir vídeo de alta velocidad y medidas articulares en etiquetas de fase fiables, PoseShot ofrece a los entrenadores algo más que una reel de momentos. Proporciona una manera estructurada de ver dónde se rompe la forma de un jugador, con qué consistencia repite posiciones clave y qué partes del movimiento separan tiros acertados de los fallidos. Aunque el sistema todavía tiene dificultades con movimientos muy similares y actualmente funciona mejor en ordenadores potentes, el estudio apunta a un futuro en el que jugadores de todos los niveles puedan recibir desgloses instantáneos y objetivos de su técnica. En términos prácticos, eso significa una práctica más dirigida, menos malos hábitos y un camino más claro desde la línea de tiros libres hasta el fondo de la red.

Cita: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0

Palabras clave: tiro libre de baloncesto, analítica deportiva, captura de movimiento, aprendizaje profundo, reconocimiento de acciones