Clear Sky Science · zh

具有多尺度与注意力模块的空间-频率互补融合网络用于去雾

2026-04-09 · 返回目录

为何清晰雾霾照片很重要

凡是尝试过拍摄雾蒙蒙的城市天际线或烟雾弥漫的高速公路的人都知道，雾霾会冲淡色彩并模糊细节。除了节日快照外，这种清晰度的丧失也会影响汽车的安全系统、环境监测以及飞机和卫星的遥感。本文提出了一种新的方法来对单张图像进行数字去雾，旨在恢复更清晰、看起来自然的场景，从而对人类和机器都更有用。

从简单技巧到基于数据的学习

早期的去雾方法依赖聪明的手工规则，例如假设场景的某些区域包含非常暗的像素，或颜色遵循特定模式。这些方法在简单情形下可能表现良好，但在光照、天气或场景布局复杂时会遇到困难。随着深度学习的兴起，研究人员开始训练神经网络学习清晰图像与有雾图像之间的差异，使其能够直接从样本中恢复干净版本。然而，大多数基于学习的方法仅在常规图像空间中工作，调整像素与局部模式，却未充分利用当将图像视为低频与高频成分混合时雾霾对图像造成的变化。

Figure 1. 一种双视角网络如何将单张雾霾照片转换为更清晰、更自然的图像。

从两种不同视角观察雾霾

作者指出，雾霾并非只是均匀地使图像变暗。将图像转换到频域后——把宽广的平滑区域与细小纹理和边缘分离——可以看到有雾的图片在中高频内容上明显丢失，而在低频能量上堆积。简单来说，诸如树叶与建筑边缘等细节会褪去，而整体亮度与色偏变得主导。仅在像素邻域上运作的标准方法难以直接纠正这种频谱失衡。论文认为，更好的去雾系统应同时在两种空间工作：日常像素视角以及凸显丢失细节的频率视角。

融合形状与纹理的网络

为实现这一想法，作者设计了 SFC-Net，一种在每个关键阶段结合空间与频率信息的神经网络。其核心特征增强模块称为空间-频率多尺度模块，它将特征分为多个分支。一个分支利用平均统计关注宽广模式，另一个分支通过最大值强调强响应，第三个分支在频域分析图像以捕捉容易被雾削弱的纹理与结构。随后这些分支被融合，使网络能够联合推断哪些区域应更亮、哪些应更清晰以及哪些细微细节需要恢复，从而产生更清晰且更真实的去雾图像。

Figure 2. 将平滑区域与细纹理分离如何帮助网络去除雾霾并恢复丢失的细节。

有指导的注意力聚焦最有用的线索

除了特征提取外，网络还使用空间-频率互补注意力模块来决定哪些区域与哪些类型的信息值得重点关注。该模块先在图像位置和通道上分别构建注意力图，然后将这些增强特征传入频率变换，使系统能够突出对去雾重要的频率分量，同时弱化不那么有用的分量。自适应门控平衡这些贡献，使网络能够对不同场景采取不同策略，例如在叶子繁茂的森林中比平滑的天空更重视细纹理。额外的残差块与精心设计的上采样头帮助在重构最终清晰图像时保留细节并避免人工伪影。

该方法在实践中的表现如何

研究人员在常用的合成与真实雾霾数据集上训练与测试 SFC-Net。他们使用信噪比、结构相似性以及一种无需参考的评分（估计图像自然度而不依赖干净真值）等标准来评估图像质量。在室内与室外测试集上，SFC-Net 能匹配或超过近期先进的去雾方法，特别是在室外场景中提升了清晰度与颜色还原度。它在真实照片和模拟真实雾的独立基准上也表现强劲，消融研究表明每个新模块对最终性能都有实质性贡献，而不仅仅是增加模型规模。

通过更智能的融合获得更清晰的视界

通俗地说，这项工作表明，清理有雾图像受益于以两种互补的方式观察它们：既作为普通图片，也作为由平滑区域与细节模式构成的频谱。通过构建一个融合这些视角并学习在哪些地方集中注意力的网络，作者比许多现有系统达到了更清晰、更自然的结果。该方法有望提升自动驾驶、监控与环境观测的可视性，为本来被雾霾冲淡的场景提供更清晰的数字窗口。

引用: Yan, C., Liu, G. Spatial-frequency complementary fusion network for dehazing with multi-scale and attention modules. Sci Rep 16, 16412 (2026). https://doi.org/10.1038/s41598-026-47027-2

关键词: 图像去雾, 深度学习, 计算机视觉, 图像增强, 频域