Clear Sky Science · zh

RT-FogNet:内河低能见度条件下的实时船舶检测

· 返回目录

穿透雾霾看见船只

当河流和运河被雾或眩光笼罩时,人工观察员和摄像头都可能难以及时发现经过的船只。这不仅是一个不便:漏报或延迟检测会威胁交通安全、拖慢物流并增加救援难度。本研究提出了RT-FogNet,一种面向内河的智能摄像系统,旨在即使在能见度低时也能可靠地检测船舶,同时在普通监控设备上仍保持足够的速度以实现实时运行。

Figure 1
Figure 1.

为什么河道比开阔海域更难识别

与开阔海域不同,内河水道狭窄、拥挤且视觉环境复杂。河岸固定摄像头必须应对桥梁、建筑、水面反光以及频繁的恶劣天气。雾、强湿度、来自太阳的逆光和夜间照明都会降低对比度并模糊船体轮廓。现有的计算机视觉检测器,包括许多流行的深度学习模型,通常是在来自卫星、飞机或沿海场景的较清晰图像上训练的。因此,当它们迁移到真实内河时往往失效,漏检小型或远距离船只,或将反光与背景结构误判为真实船舶。

为河道量身定制的智能双步“之眼”

RT-FogNet将问题视为一个适配河道摄像视角的两步流程。首先,它快速检查输入图像以判断能见度是否良好。如果视野清晰,图像直接进入检测步骤,从而节省时间和计算资源。如果场景雾霾或对比度低,图像会被送入一个专门的去雾单元——水面图像去雾(WSID)模块。该单元的训练目标不仅是让图像在人眼上更好看,而是专注于在去除雾霾并抑制水面误导性反光的同时保护船舶的轮廓和形状。

Figure 2
Figure 2.

系统如何学会穿透雾霾

WSID模块采用了源自最先进图像修复的训练策略,但经过压缩和速度优化。一个较大的“教师”网络首先在合成训练图像上学习去除雾霾。然后,一个较小的“学生”网络学习模仿教师的结果,同时使用更少的计算,使其适合实际设备。之后,学生网络在真实的雾霾河道场景上进一步微调,以确保在实验室外也能良好工作。下游的检测引擎基于最新的YOLOv10模型进行了增强处理,用于处理去雾或原始图像。一个关键改进是新增的特征处理模块,它通过精心排列的滤波器同时关注细节和更大范围的图像区域,而不会模糊掉小型目标。这有助于系统检测各种尺寸的船只,从远处的微小船只到大型油轮。

基于真实河道的新测试基准

为评估RT-FogNet在实际中的效果,作者构建了一个新的内河船舶数据集(IWSD)。该数据集包含超过九千张由固定摄像头在繁忙的中国河道(包括长江和乌龙江)拍摄的图像。数据集覆盖九类船舶和多种环境:晴朗天、阴天、雨雾、水面强烈眩光以及有强烈人造光的夜间场景。许多船舶在图像中体积很小,因为距离摄像头较远,且类别数量分布不均,反映了真实的交通格局。由于超过一半的图像是在能见度受限条件下拍摄,IWSD对任何船舶检测器而言都是一项严苛的考验。

新方法到底提高了多少?

在标准通用数据集、现有的沿海船舶数据集以及新的内河数据集上测试时,RT-FogNet在保持实时运行速度的同时始终取得了强劲的检测精度。在特别困难的IWSD数据上,包含去雾步骤的完整RT-FogNet比强基线检测器在平均检测得分上提升了超过15个百分点,尤其在小型和难以识别的船只上增益显著。即便加入了额外的去雾步骤,该系统在现代硬件上仍能每秒处理数百张图像,适用于实时河道监控。

这对水道安全意味着什么

对非专业读者而言,主要结论是:RT-FogNet展示了将场景感知的图像清理与精简的检测引擎相结合,能够使基于摄像头的河道监控变得更可靠、更可行。系统并非仅仅为人眼锐化图像,而是针对保护定位船舶所需的视觉线索进行优化,即便在浓雾或强光照条件下也能发挥作用。作者发布的内河数据集和他们验证过的设计为更安全、更智能的繁忙水道监控提供了蓝图,有望在真实河流与运河网络中减少事故并改善交通管理。

引用: Yuan, P., Xu, C., Tan, X. et al. RT-FogNet: real-time ship detection under low-visibility conditions in inland waterways. Sci Rep 16, 14094 (2026). https://doi.org/10.1038/s41598-026-44253-6

关键词: 船舶检测, 雾霾水道, 计算机视觉, 智能监控, 河道交通安全