Clear Sky Science · zh

一种用于遥感中弱小目标检测的轻量级特征融合网络

· 返回目录

从空中寻找微小目标为何重要

从交通和船舶监测到指导灾害响应,现今的卫星和无人机持续扫描地表。然而我们最关心的许多目标——小型车辆、船只或基础设施的零星部分——在图像中往往仅占据几个像素,容易被拥挤的城市街区、森林或海岸线中的杂乱背景掩盖。本文提出了GSS‑YOLO,一种新的轻量级计算机视觉系统,旨在在遥感图像中可靠识别这些微弱且细小的目标,即便图像模糊、光线暗弱或背景干扰严重。

Figure 1
Figure 1.

在大范围中寻找针眼的挑战

安装在飞机和卫星上的遥感相机一次捕获极大的区域。这种广视野很有用,但会把每个目标缩小:小目标可能仅占据10×10像素或更少。同时,背景非常复杂——云层、屋顶、树木、河流、阴影以及随季节变化的光照或天气都会增加噪声。传统检测系统要么漏检这些微小目标,要么依赖体积大、运行缓慢的模型,难以在无人机或边缘设备上实时运行。作者的目标是构建一个既能对小目标保持高精度又足够高效以在受限硬件上快速运行的模型。

为微小细节调校的紧凑系统

研究人员以流行的实时检测器YOLOv5为基础,重设计了关键部分以形成GSS‑YOLO。他们引入了三个协同工作的主要模块。首先,浅深信息聚合(SIA)模块融合图像中小尺度和略大尺度邻域的信息,帮助网络在不显著增加模型体量的情况下将细微边缘与更广的上下文结合起来。第二,SPD‑Conv结构改变了下采样时的图像尺寸缩减方式:它不是简单丢弃像素,而是先将细节以额外通道的形式重排保存,然后再进行温和压缩。第三,全局上下文感知模块(GCAM)位于最终检测器之前,扫描整幅图像以突出可能包含小目标的位置,同时抑制背景干扰。

新模块如何协同工作

SIA解决了许多视觉网络的核心弱点:普通卷积只关注局部补丁,难以获得全局上下文。通过并行运行在略有不同尺度上的滤波器,再将结果通过轻量层混合与正则化,SIA在不显著增加参数的情况下生成更丰富的小目标描述。SPD‑Conv应对的是另一类问题——激进下采样带来的信息丢失。它将特征图切分为交错的子网格并在深度方向堆叠,从而不丢弃像素;随后用一个简单的1×1卷积压缩这种更富的信息表示。GCAM则引入了一种全局“聚光”效果:沿水平方向和垂直方向分别汇聚信息以跟踪含有微小目标的行与列,并将其与一种精简的通道注意力机制结合,生成一个多维掩码,增强可能目标位置的信号并抑制其他混淆纹理。

Figure 2
Figure 2.

将模型付诸测试

为验证这些想法能否带来实际改进,团队在三个具有挑战性的数据集上评估了GSS‑YOLO。USOD包含低光照场景下的极小灰度目标;VisDrone2019提供了无人机拍摄的繁忙城市场景,充斥着微小行人和车辆;DIOR则是多样的卫星图像集合,涵盖飞机、桥梁、船舶、运动场等。在这三个数据集上,GSS‑YOLO均比一系列现代竞品(包括近期的YOLO版本以及若干专门的小目标模型)取得了更高的精度、召回率和平均检测质量。例如在USOD数据集上,它不仅实现了最佳的准确率,而且参数最少——约500万——并以最高的处理速度达到每秒数百帧。可视化样例显示,在其他系统容易出现漏检或误报的拥挤复杂场景中,它能更好地避免这两类错误。

对日常应用的意义

对非专业读者而言,核心信息是:GSS‑YOLO使在无人机、卫星或其他紧凑设备上直接运行敏锐的小目标检测变得更可行,无需依赖庞大的数据中心。通过更好地保留细节并利用全局上下文引导注意力,模型能将微弱斑点转变为可置信识别的目标。尽管在极端情况下仍可能失败——例如目标大部分被遮挡或运动模糊严重时——这项工作代表了朝着实时大范围监测的实用进展,可用于交通管理、环境观测、安全和应急响应等领域,在这些场景中快速捕捉微小细节可能产生重大影响。

引用: Wu, Z., Li, N., Tian, Z. et al. A lightweight feature fusion network for weak and small target detection in remote sensing. Sci Rep 16, 13295 (2026). https://doi.org/10.1038/s41598-026-43560-2

关键词: 遥感, 小目标检测, 轻量级神经网络, 无人机影像, 地球观测