Clear Sky Science · zh

用于多视角交通视频分析的数据集

2026-02-26 · 返回目录

为什么街上的多双眼睛很重要

任何尝试过穿越繁忙街道的人都知道，汽车、自行车和行人的运动方式常常难以预测。城市正依赖摄像头和人工智能来维持这些空间的安全，但大多数系统仍只从单一角度观察道路。本文介绍了一个新的公共视频数据集，它同时从三个不同视角记录同一人行横道，为研究人员提供构建更安全、更智能交通系统所需的丰富原始素材。

同一个人行横道，三种观察方式

该数据集聚焦于一个日常场景：西班牙穆尔西亚大学校园的一处人行横道。作者没有依赖单一摄像头，而是用三台设备同时记录每次事件：一台安装在驶近人行横道的移动汽车上的摄像头、一台固定在路边杆上较高位置的摄像头，以及一台悬停在上方的小型无人机摄像头。三种视角共同从地面、侧面和空中捕捉相同的行人和车辆，逼真地反映了不同观察者在现实中可能看到的同一瞬间。

捕捉日常步行与罕见意外

为使数据既适用于日常监测又能用于突发情况研究，团队设计了两类事件。在部分录制中，行人正常通行，汽车停下等待，反映了常见的交通行为。在另一些录制中，一名演员在斑马线上模拟跌倒，按照旨在模拟真实事故的运动模式动作。汽车始终沿相同路线行驶，行人重复相同的基本动作，这样研究人员可以比较不同场景在各摄像头下的表现，并研究异常事件如何从常规中脱颖而出。

从原始素材到强有力的研究燃料

该数据集的一个关键特点是视频文件保持原始未编辑状态。唯一的处理是添加精确的时间戳，加上一个简单的视觉提示：在每次过街开始时，一名行人短暂举手。这样便于对齐三台摄像头的帧，使得同一时间点可从每个角度进行研究。18 个视频文件覆盖了三种摄像头配置和两种过街条件（有跌倒与无跌倒），并横跨汽车、路侧装置和无人机的三种不同空间排列。研究人员还会收到额外图像，描述路侧摄像头镜头的精确光学属性，便于在需要时校正畸变。

测试机器理解场景的能力

为检验该数据集的实际价值，作者进行了标准目标检测测试，并将其录制与知名交通视频集（如 KITTI、VisDrone 和 UA-DETRAC）进行了比较。他们使用现代检测模型在视频中定位行人，并衡量预测轮廓与人工验证轮廓的匹配精度。平均来看，新数据集在检测精度和边界形状对齐度方面均得分更高。通过检查每名行人在一、二或三种视角中出现的频率，团队还展示了不同摄像头重叠覆盖在行人被汽车或街道设施遮挡时能大幅减少盲区。

这对未来街道意味着什么

对于非专业读者，核心信息是该数据集比以往的集合提供了对人行横道事件更完整的视图。通过以同步方式结合车载、路侧和空中视角，它为工程师和科学家提供了一个现实的测试平台，用以构建能够更可靠追踪行人、快速发现事故并应对障碍物和视角变化等现实复杂性的交通系统。从长远来看，此类资源有助于推动更安全的过街通行、更灵敏的交通信号以及更智能的城市服务，从而更好地保护所有道路使用者。

引用: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

关键词: 交通监控, 多视角视频, 行人安全, 智慧城市, 计算机视觉数据集