Clear Sky Science · zh

一种新型混合定制色彩校正与递归卷积神经网络的水下图像增强方法

· 返回目录

为何更清晰的水下照片很重要

无论是海洋生物学家勘察珊瑚礁、工程师检查海底电缆,还是潜水员分享周末旅行的视频,都面临同样的问题:水下照片常常显得朦胧、偏蓝绿色且细节不足。本研究提出了一种新的图像清理方法,使水下场景更接近我们在清晰空气中所见的效果,帮助人工观察者和计算机系统更好地理解海底世界。

Figure 1
Figure 1.

在水下拍照的问题

水远不只是空气的稠密版本。当光在水中传播时,某些波长被吸收和散射得比其他波长更多。红色和黄色会随着深度或距离迅速衰减,而蓝色和绿色传播得更远,这就是许多水下场景看起来带蓝色、黯淡的原因。水中的细小粒子将光向各个方向散射,削弱对比并掩盖细节。这些效应不仅令业余摄影师沮丧,也削弱了基于图像和视频进行目标检测、海底测绘或海洋生物监测等算法的性能。

已有方法及其不足

研究者尝试了许多修复水下图像的策略。有些方法依赖物理模型来描述光的吸收与散射,试图逆转该过程。还有些通过调整亮度与对比度、改变色彩平衡,或在将亮度与颜色分离的特殊色彩空间中处理图像。较新的技术使用深度学习,在大量水下图像上训练神经网络,让系统学会“良好”图像的样貌。然而,这些方法中,许多要么是具有固定步骤的手工管线,要么是一遍处理完的神经网络。当水体条件变化、光照不均或噪声较强时,它们难以适应和逐步改进结果。

Figure 2
Figure 2.

从混浊到清晰的混合路径

作者提出了一种混合方法,结合经典色彩校正的优点与现代递归卷积神经网络(R-CNN,一种设计用于反复精修预测的深度学习模型)。首先,一个定制的色彩校正阶段分析不同波长的衰减程度并相应调整每个色彩通道。它不是盲目地增强红色或削弱蓝色,而是估计该特定水下环境中光的衰减强度,从而恢复更自然的色调。随后图像被转换到一种更贴近人类感知的色彩空间,将整体亮度与色彩成分分离,使得在不破坏细节的前提下更容易纠正失真。

让网络反复重审图像

在初步色彩校正之后,精修图像被送入递归神经网络。与只分析图像一次的标准网络不同,该设计将输出循环回输入,使模型能够在若干次迭代中重新考虑场景。每次迭代中,它会锐化边缘、清理噪声、改善对比,同时尽量避免产生人工光晕或过度增强的区域。额外的处理步骤以保护物体边界的方式平滑噪声,对蓝绿通道的专门处理有助于矫正最常见的水下颜色失衡。因此,整体管线从原始带色偏的图像逐步过渡到越来越清晰、更准确的表现。

来自多样水下场景的证据

为了评估该方法的效果,研究者在多种公共水下图像集合上进行了测试,覆盖了合成与真实场景,以及静态图像与视频。他们使用标准指标评估图像的清晰度、结构相似性和噪声水平,也使用那些不需要完美参考图像的评分方法——这在海洋场景中很重要,因为很少有真正“正确”的视图。无论是珊瑚礁、海床上的雕像、游动的鱼类还是潜水员,他们的方法在评分上普遍优于竞品,并生成了人类评审认为更清晰、更富色彩且细节更丰富的图像。

对海底观测的意义

简而言之,这项研究表明:先精心修正色彩,然后让智能网络反复打磨结果,能够得到更自然且信息量更大的水下图像。尽管该方法在极暗环境下仍存在挑战,且现有的质量评分并不能完全反映人类判断,这种混合方法已为物体检测、检修和环境监测等水下任务提供了实用提升。随着进一步改进和更好的图像质量评估手段,此类工具有望成为水下相机与机器人中的标准组件,为我们打开更清晰的海洋之窗。

引用: Natarajan, D., Sudhakaran, P. & Bereznychenko, V. A novel hybrid customized color correction and Recurrent Convolutional Neural Networks approach for underwater image enhancement. Sci Rep 16, 14006 (2026). https://doi.org/10.1038/s41598-026-44535-z

关键词: 水下成像, 图像增强, 色彩校正, 深度学习, 海洋视觉