Clear Sky Science · zh
通过密集学习突破自动驾驶车辆安全性能停滞
为何更安全的无人驾驶汽车很重要
无人驾驶汽车承诺减少交通事故、缓解拥堵并为更多人提供出行便利。然而,经过多年的炒作和数十亿美元的投入,能够在各种条件下可靠行驶的真正无人驾驶车辆在公共道路上仍很少见。主要障碍是安全:现有系统在突发并且风险高的情形下表现欠佳,例如突然并道、攻击性驾驶者或复杂令人迷惑的路口。本文提出了一种新的训练方法,针对那些罕见但关键的时刻,旨在将安全性提升至接近人类的水平并推动更广泛的应用。
稀有危险的隐蔽问题
大多数时候,驾驶平稳无事:车辆保持车道、保持距离,没发生重大事故。对学习算法来说,这反而是坏消息。现代自动驾驶依赖深度学习,通过在海量数据中发现模式来改进。然而,严重的碰撞和接近碰撞在这些大量正常驾驶数据中非常罕见。随着车辆变得更安全,最危险的事件变得愈发稀少,导致学习过程缺乏最需要的样本。作者称之为“稀缺的诅咒”。它在训练中带来高度不确定性,并在实际中造成一种安全性停滞:在一种情形下修复性能可能会使另一种情形变差,这种权衡被描述为“跷跷板效应”。
仅从事故中学习为何会适得其反
许多开发者试图通过聚焦失败来解决稀缺问题:回放最严重的事故和棘手的边缘案例,然后训练系统避免这些特定错误。研究表明,这种直观策略可能具有误导性。单纯集中于事故数据会引入偏差:系统可能在一小类场景上变得非常强,但在其他同样重要的场景上在不自知中变差。换言之,学习过程被推离了正确方向。基于规则的安全层使用人工制定的规则来阻止明显的危险,在某些情况下有帮助,但面对现实交通的巨大多样性和复杂性时仍显吃力。总体来看,这些方法不足以持续改进整体安全性。

让每一个有用时刻都发挥价值
作者提出了一种“密集学习”策略,通过重塑训练数据而不是简单地增加数据量来应对问题。他们不再把所有驾驶时刻一视同仁,而是在仿真和真实世界的驾驶片段中筛选出最具信息量的片段。这些片段不仅包括可避免的碰撞(若做出更好决策本可防止碰撞),还包括“擦边”情形,即几近发生碰撞但最终被避免的近失事件。长时间的驾驶片段会被剪裁,仅保留安全关键的时间片段,然后将这些片段重新连接,形成一个紧凑且信息丰富的训练集。一个学习得到的安全评分用于自动标记高风险状态,回顾性步骤利用反事实仿真将过去的数据与最新驾驶策略重新校验。这三层密集化——情节级、状态级和回顾性——大幅降低了学习中的随机性,同时保持训练信号的真实性。
适用于多种车辆的安全副驾
利用这一密集学习流程,团队训练了一个以安全为中心的驾驶代理称为“SafeDriver”。SafeDriver并非取代现有的自动驾驶系统,而更像一个保护性的副驾:在正常情况下,基础系统继续主控;但当学习得到的安全评分检测到危险状况时,SafeDriver会短暂接管制动和转向,将车辆引离险境。研究人员在多种条件下测试了这一想法:高速多车道公路、复杂环形交叉口以及基于大型真实驾驶数据集构建的城市街区网络。在仿真中,加入SafeDriver后,与仅使用底层系统相比,碰撞率降低约一个到两个数量级,而“可避免”碰撞的减少则更为显著。

从仿真到测试跑道
为检验方法在现实环境中的效果,团队在一辆运行开源Autoware系统的林肯轿车上安装了SafeDriver,并在Mcity测试场利用混合现实场景进行评估。虚拟车辆和交通信号被叠加到真实摄像头画面中,从而在不危及真实道路使用者的前提下重复制造高风险情形。在将仿真器仔细调校以匹配实际车辆行为后,他们在跑道测试中展示出SafeDriver可将整体碰撞率约降低90%,可避免碰撞几乎降低99%。同样的密集化训练也提升了在覆盖四个城市的大型多样化城市规划基准上的表现。
对日常驾驶者意味着什么
简单来说,这项工作表明通向更安全无人驾驶汽车的道路不只是更多数据,而是更智能的数据。通过将训练集中在那些安全岌岌可危的稀有时刻——既包括千钧一发的近失,也包括本可避免的碰撞——密集学习方法为改进提供了更清晰、更稳定的信号,而不会以牺牲其他情形的性能为代价。尽管还需更多研究以将该思路推广到其他安全关键的机器(例如医疗机器人或飞机),但这些结果表明自动驾驶车辆有望打破当前的安全平台期。如果被广泛采用,类似方法可能会使无人驾驶技术更接近公众在信任车辆自动驾驶前所期望的可靠性水平。
引用: Feng, S., Zhu, H., Sun, H. et al. Breaking through safety performance stagnation in autonomous vehicles with dense learning. Nat Commun 17, 3163 (2026). https://doi.org/10.1038/s41467-026-69761-x
关键词: 自动驾驶车辆, 无人驾驶安全, 强化学习, 稀有事件, 机器学习训练数据