Clear Sky Science · zh

基于小波变换与渐进特征金字塔网络的高效目标检测方法:电网巡检案例研究

· 返回目录

守护输电线,排除隐匿危害

电力维持着现代生活的运转,但承载电能的输电线比看上去更脆弱。气球、风筝、塑料袋或鸟巢等日常物品可能缠绕在高压线路上,引发火花、停电和昂贵修复。供电单位越来越多地依赖无人机和摄像头巡检长距离线路,然而在人眼或常规 AI 系统面前,在杂乱图像中发现微小、低对比度物体仍然困难。本研究提出了一种更快、更精确的计算机视觉方法,帮助巡检团队实时自动检测这些隐患。

Figure 1
Figure 1.

小目标为何难以察觉

输电走廊的影像在视觉上具有挑战性。画面大多由天空、田地或河流等宽阔、平滑区域构成,而安全关键部分——电缆、绝缘子和异物——则表现为细线或小斑块。像 YOLO 这类为日常照片(如人物或车辆等较大、清晰对象)设计的主流实时检测系统,在航拍电力影像中往往力不从心。气球或垃圾碎片可能仅占据少数像素,并常与塔架或导线融为一体,导致漏检、把背景结构误报为目标以及场景复杂时性能不稳定。

让 AI 用频域“读”图像

作者通过改变神经网络“看”图像的方式来应对这一问题。他们在常规像素卷积之外增加了一个基于小波的小波卷积层(WTConv)。小波将图像分解为捕捉平滑背景的低频部分和突出边缘与细节的高频部分。在该设计中,网络分别处理这些频带然后无损地将它们重组。这意味着它既能保持宽阔走廊的上下文信息,又能增强导线、塔架和微小异物等结构,而不会使模型变得更重或更慢。

堆叠特征以跨尺度观察

检测停在塔臂上的鸟巢或跨越多根导线的风筝,还需要理解图像中不同尺度之间的关系。为此,研究引入了渐进特征金字塔网络(PFPN)。它从网络的浅层和深层提取特征,并通过两次传递进行融合:先从粗到细,然后再从细到粗。一个“自适应融合”步骤对每个位置学习各个尺度的可信度。这种渐进式堆叠产生的特征图与真实异物对齐更好,减少了微小危害与大型金属结构重叠时的混淆。

Figure 2
Figure 2.

细化目标框的绘制方式

即便模型猜对了目标,仍需在其周围画出精确的边框。常用的训练准则侧重于预测框与真实框的重叠程度,但对于微小、模糊的目标这可能具有误导性。研究者通过一种新的“Inner-EIoU”损失对这一环节进行改进,该方法特别关注框中心区域的一致性。通过奖励核心区域的紧密对齐,该方法帮助模型锁定微小或部分遮挡异物的真实位置,使最终检测更可信。

在真实场景中证明改进效果

为验证其设计,团队构建了一个包含 4,700 张真实高压走廊图像的专项数据集,覆盖城市到乡村的场景,并标注了四类常见隐患:垃圾、气球、鸟巢和风筝。与标准 YOLOv11 基线相比,改进后的模型在提高检测率的同时降低误报,提升了精度和整体检测分数。同时,它的参数量约减少五分之四,运行速度快约 18%,更适合必须实时工作的无人机或边缘设备。在公开的大型基准(MS COCO)上的测试也显示出类似改进,表明这些思路具有超出电力线路场景的泛化能力。就实际应用而言,这意味着公用事业单位可以部署更聪明、更轻量的巡检系统,更早发现小型隐患,避免造成重大问题。

引用: Ye, J., Yuqi, B., Wendi, W. et al. Efficient target detection method based on wavelet transform and progressive feature pyramid network: a case study of power grid inspection. Sci Rep 16, 7318 (2026). https://doi.org/10.1038/s41598-026-37017-9

关键词: 电网巡检, 异物检测, 无人机影像, 实时计算机视觉, 高压输电线路