Clear Sky Science · zh
基于改进Transformer的雾天道路场景图像预测算法
看透雾霾为何重要
在浓雾中驾驶就像直面一堵白墙。对人类驾驶员和自动驾驶汽车而言,能见度低会把普通道路变成危险地带。本研究探讨了一种新方法,帮助计算机在雾中更清晰地“看见”——将模糊的街景转换为更清晰、更具信息量的图像。目标不仅是更好看的图片,更是让必须在各种天气下识别车道、车辆和障碍物的自动驾驶系统做出更安全的决策。
从模糊道路到更清晰视野
雾通过散射光线来退化图像,使颜色褪去、边缘变软并隐藏远处物体。传统方法试图通过关于雾如何作用的人工规则来逆转这一过程,或采用一种放之四海皆准的对比度增强手段。较新的深度学习方法有所改进,但许多方法难以捕捉场景中的远程关联,例如远处的车道标记或车辆与近景之间的联系。它们通常也较为笨重和缓慢,这对必须实时反应的车辆来说是个问题。
针对雾天道路的更智能视觉引擎
为应对这些局限,作者设计了一种基于现代人工智能架构Transformer的专用视觉系统——该架构最初用于处理语言,但现在已被改造用于图像。网络以单幅雾天道路图像为输入,预测出更清晰的图像并估算司机可见的前方距离。它将图像分割成多种尺寸的重叠块,从而既能关注车道边缘和交通标志等细节,也能把握道路的总体布局。这些块随后在多个并行分支中处理,每个分支针对不同的雾浓度进行调优,使得轻雾与重雾可以分别处理,而不是被强制通过同一处理流程。

关注结构而非噪声
在该系统内部,关键创新是一种精简的注意力机制,允许网络在不引发计算爆炸的情况下权衡图像中远距离部分之间的关系。作者对一项代价高昂的内部计算进行了近似,使其行为相似但运行更快,将一个缓慢的二次复杂度步骤转变为更高效的过程。这有助于模型集中关注重要结构——例如车道线的排列和车辆轮廓——同时忽略大部分随机的雾噪声。额外的注意力模块进一步细化哪些特征通道最重要以及哪些空间区域值得关注,进一步增强对导航关键边缘和形状的识别。
在真实与合成雾上测试
研究者组建了三个道路场景数据集,混合了计算机生成的雾与来自城市和高速公路的真实雾天图像,涵盖轻雾、中雾和浓雾。他们训练系统同时生成去雾图像和能见度估计,然后将其与一个强大的物理引导方法及若干领先的去雾模型进行比较。该方法在许多情况下恢复了更多道路细节——尤其是远处的车道标记和车辆轮廓——同时使用的参数远少于一些流行的替代方案。重要的是,它在类似现代汽车上可能配备的图形硬件上运行速度足以实时使用,即使在较高分辨率下也能保持每秒数十帧。

更清晰的画面带来更安全的决策
通俗地说,这项工作提供了一个轻量级的“数字去雾器”,帮助自动驾驶系统在恶劣天气下看清更多道路情况。虽然并非完美——在非常浓密或复杂的场景中仍可能出现色彩偏移和伪影——但它在图像质量与速度之间达成了实用的平衡。通过结合多尺度视图、针对不同雾级的专用分支以及高效的注意力机制,该方法在不让车载计算机不堪重负的前提下提供了更清晰、更具信息性的道路图像。这使其成为朝着在雾霾等能见度低的条件下实现更安全自动驾驶迈出的有前景的一步。
引用: Zhang, BT., Zhao, AY. & Xiong, P. Image prediction algorithm for foggy road scenes based on improved transformer. Sci Rep 16, 9579 (2026). https://doi.org/10.1038/s41598-025-25974-6
关键词: 雾天道路视觉, 图像去雾, 自动驾驶, 基于Transformer的成像, 恶劣天气感知