Clear Sky Science · zh

PoseShot：通过姿态分析进行罚球动作识别的混合 CNN–BiLSTM Transformer 模型

2026-03-01 · 返回目录

为经典投篮提供更智能的训练

对于任何曾站在罚球线上的人来说，球进或偏出的差别常带有神秘感。这项研究展示了人工智能如何将这种神秘转化为清晰、客观的反馈。通过细致解读球员罚球时的身体姿态，研究者开发的系统 PoseShot 将投篮分解为可理解的阶段，并揭示哪些动作将稳定的技术与不稳的表现区分开来。

将罚球拆解为明确阶段

PoseShot 并不将罚球视为单一、简单的动作，而是把它看成五个不同阶段的序列：运球、停稳、上举、投篮和随动。团队收集了 75 段球员在不同体育馆、光照条件和摄像角度下的罚球视频，并为数千帧贴上了这些阶段标签。这种细粒度的方法使系统能够提出更具体的问题：球员在停稳阶段停顿得足够久吗？上举阶段手臂的轨迹是否平滑？随动在每次出手间是否一致？

用计算机视觉解读身体

为了解球员的动作，PoseShot 将对同一动作采取两种互补的观察视角。首先，它分析原始视频图像，使用一种称为卷积网络的神经网络来捕捉每帧的形状、肢体位置和运动线索。其次，它对视频运行姿态估计工具，标注出全身的二维关节点位置。基于这些点，系统计算出八个关键关节角度，包括双肘、髋部和膝盖等。这些角度构成了随时间变化的姿态数值指纹，刻画能量如何从腿部通过躯干传递到投篮手臂。

融合两路运动智能

PoseShot 的核心是一个并行处理图像与姿态的双通路结构。图像流通过若干层逐步浓缩视觉细节为紧凑特征。姿态流则将关节角度序列输入一种时间感知网络，该网络跟踪身体姿势如何前后演变。在两条流之上，系统加入了 Transformer 层，类似注意力机制，突出动作中最有信息量的瞬间与相互关系。最终，系统将两条流合并，送入分类器，逐帧判断球员所处的罚球阶段。

胜过其他 AI 教练

为评估 PoseShot 的表现，研究者将其与一系列流行的深度学习模型进行比较，从传统的图像网络到最新的基于 Transformer 的设计。使用一种同时奖励准确命中与避免错误的平衡指标，PoseShot 得分约为 100 分中的 96 分，总体上击败了所有竞品，并在关键的投篮阶段表现尤为突出。该系统在识别像停稳、投篮和随动这类明确动作时表现特别好。最难分辨的是运球与上举，这两者在实际比赛中常常互相融合，差异更多体现在细微的时序和速度上，而非明显的姿态变化。

从数据到可操作的训练建议

通过将高速视频和关节测量转化为可靠的阶段标签，PoseShot 为教练提供的不仅仅是集锦。它提供了一种结构化方式，帮助观察球员姿势何处崩解、关键位置重复的稳定性，以及哪些动作将进球与失误区分开来。尽管该系统仍难以处理极为相似的动作且目前在高性能计算机上运行最佳，研究指出未来各级球员都能获得即时、客观的技术解析。实际上，这意味着更有针对性的训练、减少不良习惯，以及从罚球线到篮筐更清晰的路径。

引用: Hsu, WC., Lee, CC., Lee, YH. et al. PoseShot: hybrid CNN–BiLSTM transformer model for free throw action recognition via pose analysis. Sci Rep 16, 11478 (2026). https://doi.org/10.1038/s41598-026-41025-0

关键词: 篮球罚球, 体育分析, 动作捕捉, 深度学习, 动作识别