Clear Sky Science · zh

一种用于远距离小型交通标志检测的自适应多尺度轻量化网络

· 返回目录

为什么微小路标很重要

现代驾驶辅助和自动驾驶汽车依赖于快速且可靠地识别交通标志,即便这些标志在远处只是图像中的微小斑点。漏掉一个远处的限速标志或误判一个警示牌可能导致迟缓或不安全的决策。然而车载计算资源有限,远处标志容易被建筑、树木和眩光淹没。本文提出了YOLO‑AML,一种精简的视觉系统,旨在实时识别远距离、小型交通标志,帮助车辆在不增加大量硬件负担的情况下“看得更好”。

Figure 1
Figure 1.

看清小标志的挑战

在真实交通场景中,同一类标志在近处可能很大,而在远处占据图像不到千分之一。天气、阴影和遮挡会进一步模糊或隐藏这些标志,仪表盘反光和路边杂物也会产生干扰纹理。传统计算机视觉方法依赖手工设计的颜色和边缘线索,遇到光照变化时常常失效。较新的深度学习系统,如广泛使用的YOLO系列,速度更快且更准确,但在为提高处理效率而缩小图像时仍会丢失细节,而且通常需要比车载设备能提供的更多计算资源。

一种既轻量又保留细节的网络

YOLO‑AML基于近期的YOLO设计,对内部层进行了重构,使其既更轻量又更注重小目标细节。系统没有使用在下采样时丢弃像素的标准操作,而是采用“space‑to‑depth”步骤,将像素重新排列到额外的通道中。这样在减小宽高的同时保留了原始信息,既降低了计算量,又保存了微小标志的纹理。一个名为CLSKA的重设计主干模块使用了既大又经济的滤波模式,既能观察局部边缘,也能兼顾更广的周边环境,使网络能够在不显著增加体量的情况下,将微弱的红色或黄色与道路上下文联系起来。

Figure 2
Figure 2.

更智能的注意力与更稳健的框度量

仅仅保留细节还不够,因为远景中充斥着树木、建筑、路灯柱和道路标线,会干扰检测器。为了解决这一问题,YOLO‑AML加入了一个名为NAST的注意力模块,该模块巧妙地重复利用网络内部已有的归一化数值作为判断哪些信息可忽略的线索。表现得像背景的通道和像素被弱化,而类似潜在标志的则被增强,且无需增加额外的重型层。在输出阶段,系统还改变了学习如何绘制标志边界框的方式。它不再依赖在微小位移时可能骤降为零的重叠分数,而是将每个框视为一个柔和的斑块,并用平滑的距离度量来衡量这些斑块的相似性。这为模型在标志极小的情况下也能提供稳定的训练信号。

系统测试

作者在一个大型中国路标数据集和一个独立的欧洲基准上评估了YOLO‑AML,涵盖了数千个城市和高速公路场景。与强基线和若干流行的YOLO变体相比,新系统在检测到真实标志的比例上更高,同时运行更快且使用更少参数。在主数据集上,其模型体积缩小约六分之一且处理速度提升,同时准确率仍有所提高,尤其是在远距离和部分遮挡的标志上。可视化的“热力图”也证实网络更紧密地集中在实际标志上,对无关纹理和阴影的干扰更少。在低功耗Jetson Nano板上的测试表明,该方法在受限的内存和速度条件下仍能工作,突显了其适用于嵌入式场景的潜力。

这对未来汽车意味着什么

通俗地说,YOLO‑AML就像给汽车配备了更清晰的远距视力和更好的注意力,同时让计算“脑袋”保持小而高效。通过保留微小图像细节、将注意力从杂乱中引导开来,并采用更宽容的框位置判定方式,该系统能更早、更可靠地识别小型交通标志。这种准确性、速度与轻量化的组合使其成为未来驾驶辅助和自动驾驶平台的有前途的构件,在这些场景下每一毫秒和每一瓦计算能耗都至关重要。

引用: Liang, R., Qu, W. & Li, S. An adaptive multi-scale lightweight network for long-distance small traffic sign detection. Sci Rep 16, 13459 (2026). https://doi.org/10.1038/s41598-026-43920-y

关键词: 自动驾驶, 交通标志检测, 小目标检测, 轻量化神经网络, YOLO