Clear Sky Science · zh

基于计算机的智能单目视觉立定跳远测量系统

· 返回目录

为什么跳远距离很重要

立定跳远是全球学校检测学生体能的最简单方法之一:站在起线,尽力一跳,然后测量距离。但在拥挤的操场上,这个看似简单的测试也会变得混乱。教师仍需弯腰用卷尺测量,结果可能产生争议,记录大量跳跃既缓慢又累人。本研究提出了一种基于摄像头的系统,能够从普通视频中自动且精确地测量跳远距离,有望实现更快、更客观的测试,而无需昂贵的专用硬件。

从卷尺到智能摄像机

现有的自动跳远测量工具通常依赖超声波传感器、压力垫或横跨沙坑的光束。尽管有效,但这些设备安装成本高、受天气影响大,难以在大规模学校环境中维护。作者将该任务视为视觉问题:如果单台摄像机既能看到运动员的脚又能看到跳垫,软件就应能推算出运动员的实际移动距离。他们设计了一整套管线,将原始视频实时转换为最终距离数值,结合了现代计算机视觉方法与严谨的几何推理。

Figure 1
Figure 1.

系统如何“看见”一次跳跃

流程从一台放在跳垫侧边几米处的高速摄像机开始,拍摄清晰的240帧/秒视频。软件首先将视频分解为单帧,并用现成的检测器快速判断运动员何时进入和离开画面。在此时间窗口内,它搜索图像中脚后跟高度最高的瞬间(跳跃顶点),随后寻找着地点位置不再变化的后续帧,以识别稳定落地。这样的关键帧自动选择避免了逐帧分析的浪费,并减少了运动员仅半露出画面时造成的干扰。

找到跳垫、脚后跟与真实距离

一旦定位到落地帧,名为FastNetSeg的定制视觉模型便接手。这个轻量级网络结合了两种思想:一个Transformer分支负责捕捉场景的全局布局,紧凑的卷积分支则关注局部细节。二者共同为属于运动员和跳垫的像素上色(分割)。从跳垫掩模中,算法追踪外边界、平滑小的凹凸,并将其提炼为四个可靠的角点。从运动员掩模中,另一套算法检查下左侧身体区域的轮廓,滤除无关区域,并通过曲率定位脚后跟——本质上寻找脚背与地面相接处的急转角。这些关键点构成了测量的原始要素。

将像素转为厘米

由于摄像机以一定角度俯视跳垫,图像中的距离并不直接对应真实世界的厘米:图像中靠近远端的像素可能表示比靠近摄像机的像素更多的实际距离。为克服这一点,系统学习了从图像坐标到跳垫平面坐标的“映射”,采用一种标准的几何工具——透视变换。已知跳垫的真实长宽,软件即可计算出任意可见点(尤其是脚后跟)在俯视地面地图上的位置。随后它还基于标定跳跃拟合一个简单的多项式曲线,作为额外的校正步骤,以减小摄像机视野边缘残留的小系统误差。

Figure 2
Figure 2.

在真实环境下的表现如何

为了在现实条件下测试系统,研究者构建了一个专用数据集:来自200名大学生的1200次跳跃,在不同时间和不同天气条件下室外拍摄。人工标注员绘制了运动员和跳垫的像素级轮廓用于训练与评估模型。在现代但易得的GPU硬件上,完整系统的处理速度约为23帧/秒,足以满足学校测试的实时使用。最关键的是,当其距离估计与细致的卷尺测量相比时,平均误差仅约0.71厘米——不到一根手指的宽度。移除任何关键模块(如不完整运动员过滤、单视图映射或精确脚后跟定位)都会显著降低精度,凸显出整体设计的重要性。

更清晰、更公平的跳跃测试

简而言之,这项工作表明,单台智能摄像机可以在不牺牲精度的情况下,替代手动卷尺和昂贵的传感器设备来测量立定跳远。通过结合快速视频分析、对运动员和跳垫的精确分割、从图像到地面坐标的严密几何转换以及最终的误差平滑步骤,该系统实现了厘米级的实时可靠性。配合开源代码与标定工具,学校和体育项目可以广泛部署这一方法,从而使体能测试更快速、更公平、对人工判断的依赖更小。

引用: Kuang, G., Li, S., Liu, Y. et al. A smart monocular vision metrology system based on computer for standing long jump. Sci Rep 16, 14611 (2026). https://doi.org/10.1038/s41598-026-44523-3

关键词: 立定跳远, 计算机视觉, 运动测量, 深度学习, 体能测试