Clear Sky Science · zh

基于改进YOLOv7的河道浮动物体小目标检测

· 返回目录

为什么发现河流中的微小垃圾很重要

河流和运河常常携带难以察觉的微小垃圾——瓶子、树叶、塑料碎片等。这些看似微不足道的物体却能对生态系统、洪水安全和人类基础设施造成重大影响。无人机和固定摄像头能够实现持续监测,但即便是先进的计算模型也难以从闪烁且不断变化的水面中识别出这些小而快速移动的目标。本文提出了一种新的方法,使计算机能更准确、更快速地在河流场景中找到此类微小漂浮物,为更清洁的水道和更安全的运行带来可能性。

穿透流动水面的视觉难题

用视频观察河流时,人眼可迅速注意到漂浮的碎片,即便阳光在水面闪烁、波纹无规律地摆动。对计算机来说,这更加困难。小目标在水面起伏时形态会变化,反光会伪装成明亮物体,阴影会遮蔽暗弱目标。传统检测系统会在每一帧中为可能的物体画框,但这些框在相邻帧间会发生偏移和闪烁。这种不稳定性浪费计算资源,也很容易完全丢失小目标。结果是漏检、误报和处理缓慢并存,尤其是在需要实时分析数千帧时。

Figure 1
Figure 1.

一种更智能的方法以确认真实存在的物体

作者提出了一个称为“区域重叠检测”(Region-Overlap Detection)的新框架,结合精简版的流行检测器YOLOv7。系统不再单独处理每一帧,而是观察若干连续帧并提出一个简单问题:这些检测框随时间如何对齐?那些跨帧稳定重叠的区域,比只在短时间出现或跳动的区域更值得信赖。通过首先关注这种稳定的重叠区域,该方法过滤掉许多关于物体位置的噪声和不稳定猜测。只有最可靠的检测框会被传递到后续流程进行更深入的分析,从而在进行高代价计算之前为系统提供更清晰、更稳定的场景视图。

用更少的网络步骤做更多事情

现代视觉系统通常依赖深层堆叠的处理层来学习识别形状、边缘和纹理。尽管功能强大,这些层计算开销大,并可能淹没来自微小目标的细微信号。新方法保留了YOLOv7的总体思路,但刻意减少了这些处理步骤,仅在基于重叠的分析表明可能存在真实物体的区域启用它们。那些主要只会看到背景水面或随机噪声的层被跳过。所谓的“最小卷积”策略在保留微小漂浮物清晰边界的同时降低了计算量。实际上,网络将其计算资源集中在最重要的位置,而不是把每个像素一视同仁地处理。

Figure 2
Figure 2.

在真实河流上的实验验证

为了检验该方法在实际中的效果,团队在无人机拍摄的真实河流视频上进行了训练和测试,使用了包含近四万个不同尺寸浮动物体的大规模标注图像数据集。他们还在其他公开数据集和包含光照、流速与视角变化的长河流视频序列上验证了性能。与原始YOLOv7及若干新型检测器相比,该系统发现了更多真实目标、漏检更少,并且帧处理速度更快。研究报告显示,对小型漂浮物的平均精度(mAP)超过73%,召回率超过70%,同时在处理速度和网络参数与运算量上都有显著提升。

对更清洁、更安全水道的意义

简单来说,论文表明通过在帧间稳定计算机“认为看到”的内容,然后精简不必要的计算,能显著提高在动荡水面上识别微小漂浮碎片的能力。尽管该方法仍需在更广泛的河流和条件下进一步测试,但它已在具挑战性的河流场景中优于若干知名模型。这使其成为安装在无人机、桥梁或河岸监测站上的实时监测系统的有前景的组成部分。此类系统可帮助城市和环保机构追踪垃圾、管理洪水风险并快速应对污染事件,将原始视频流转化为可靠且可操作的信息。

引用: Yang, W., Zhang, B., Guo, S. et al. Small target detection of floating objects in river channels based on improved YOLOv7. Sci Rep 16, 11423 (2026). https://doi.org/10.1038/s41598-026-40688-z

关键词: 河道垃圾检测, 无人机河流监测, 小目标检测, 水域计算机视觉, YOLOv7改进