Clear Sky Science · zh
用于分层交通控制、具有精细网络的城市尺度高分辨率交通数据集
为什么城市交通需要更好数据
凡是在一连串红灯下等待或在拥堵的市中心街道上缓行过的人,都能体会到城市交通的混乱。然而,大多数控制交通信号和管理流量的系统仍依赖不完整、低细节的数据。本文介绍了一组新的城市尺度交通数据集,旨在为研究者和规划者提供更清晰的真实道路网络车辆移动图景,从而为更智能、更协调的拥堵控制打开可能性。
从几条街到整个城市
作者汇集并标准化了来自五个截然不同城市地区的详尽交通数据:济南、杭州、曼哈顿、南昌和宣城。这些城市覆盖了从只有十几个路口的短干道走廊到拥有数千个交叉口的庞大网络等各种规模。早期的开放数据集通常聚焦于小型整齐的网格和短暂的一小时快照。相比之下,这组数据涵盖了多种道路布局、路口形状和出行需求模式。其中一项突出贡献是宣城数据集,它以精细的细节表示了几乎整座城市,包含数百个交叉口的建模——包括各车道如何排列以及复杂路口的结构。

看到每一辆车,而不仅仅是样本
大多数现有交通数据来自摄像头或稀疏传感器,这些仅能短时间内窥见网络的部分区域。宣城数据采取了不同的方法。该市在关键路段安装了自动车辆识别(AVI)系统,记录每辆车的进出时间。通过匹配入口和出口记录中的匿名标识,作者重建了整个月内每日数十万次出行的完整路径。这使他们能够观察司机实际如何选择路线、工作日与周末的流量如何变化以及节假日如何重塑出行需求。车辆还按大类进行分类,例如客运和货运,使仿真能反映不同类型车辆对交通的不同影响。
将混乱记录转成统一地图
由于五个城市的原始数据存储格式和细节层次各不相同,团队开发了统一的处理流程。首先,他们将每个道路网络重建为一致的数字地图,识别交叉口并连接道路,即便原始数据采用了不同的几何定义。他们通过用简单矩形包围原始形状来估算路口的大小和位置,并使用优化方法将各进口方向与基准方向对齐。接着,他们通过定义一小组典型通行模式(例如左转或沿走廊的直行)来标准化交通信号,并自动将每个真实路口匹配到这些模式。最后,他们构建车辆流并清洗数据:删除不合理路线、从网络中推断缺失路段,并将许多短时传感器记录组装成连续的出行。

从单辆车到整个网络
在出行和网络建成之后,作者在三个层次上生成交通“状态”数据。在最详细的层次,他们跟踪单个车辆,包括其位置和速度,可用于检验诸如更平滑的路径规划或车队纵队行驶等想法。在中间层次,他们汇总每条车道和路口的状况,如排队长度和密度——这些信息对调校交通信号至关重要。在最宽泛的层次,他们整合整个城市区域的状况,支持调控进入拥堵区域车辆数量的策略。所有这些都以统一的仿真格式(CityFlow)打包,使不同的控制方法能够公平、高效地进行测试。
检验数字城市与现实的匹配度
为确保重建的世界与真实世界相似,研究者对地图和出行都进行了验证。他们将转换后的路网与原始地理数据比较,发现大多数连接和位置在几米之内得到保留。对于出行,他们在选定道路上对车辆进行仿真并将行程时间与真实测量值比较;平均值非常接近,少量差异可由现实中司机偶尔超速等因素解释。他们还展示了派生的状态数据能够支持先进策略:利用车道级信息施加基于压力的信号控制,再加上城市范围的“周边”控制以防止核心区域过载,最终展示基于这些信息重路由单辆车在拥堵时可以显著减少其行程时间。
这对普通驾驶者意味着什么
对非专业读者而言,这项工作的意义更多在于它奠定的基础而不是算法本身。通过发布详尽、经过验证并公开记录的数据集,作者为交通工程师和人工智能研究者提供了一个现实的试验场,可以在触及真实街道之前设计和测试新的控制方案。借助对道路布局、信号运行以及日常与周间需求起伏的准确表征,未来的工具可以被调优以减少延误、节省燃料并使城市出行更可预测。简言之,这些数据集是朝着能够应对真实世界复杂性的交通系统迈出的重要一步,而非仅依赖理想化模型的过渡物。
引用: Ma, Q., Guo, X., Zhong, W. et al. City-scale high-resolution traffic datasets with refined networks for hierarchical traffic control. Sci Data 13, 547 (2026). https://doi.org/10.1038/s41597-026-06892-2
关键词: 城市交通数据, 分层交通控制, 交通仿真, 自动车辆识别, 城市尺度出行