Clear Sky Science · zh

基于多尺度感知与位置敏感学习的细长电力目标精确分割方法

· 返回目录

确保供电持续、安全

现代生活依赖于通过庞大电力网络顺畅流动的电力。这张电网大部分架空在我们头顶,老化的导线、恶劣天气和人为失误都可能引发停电甚至事故。公用事业单位越来越多地依赖摄像头和人工智能实时监控这些线路,但要让计算机在复杂背景中清晰识别细长的导线比想象中困难得多。本研究提出了一种新的图像分析方法,能帮助计算机在真实、杂乱的场景中更精确地追踪电力线路,从而增强日常供电的安全性和可靠性。

为什么找到细线如此困难

乍看之下,在照片中识别一根电线似乎很简单:只要找一条长长的暗条纹对着天空就行。但现实要复杂得多。与整幅图像相比,电线往往非常细,它们可能相互交叉、弯曲,并以多种角度出现。导线经常被设备、建筑、树木或工作人员使用的工具部分遮挡。传统的深度学习图像分割工具——将每个像素标记为“导线”或“背景”的技术——主要为更粗壮、团状的目标(如汽车或行人)设计。这些方法往往模糊导线边缘、将其断裂成片段,或将其与其他细长物体混淆。对于无需断电即可作业的带电维护而言,这类错误会削弱安全告警和巡检系统的效力。

Figure 1
Figure 1.

观察电力线的新方法

研究者在一种流行的图像分割结构U-Net的基础上改进,该结构在多个分辨率上处理图像然后再融合信息。他们的新系统称为MSHNet(多尺度头网络),在多个尺度上同时增加了额外的“头”以进行预测。每个头关注不同层次的细节,使模型既能关注导线的整体走向,又能捕捉其精细边缘。所有这些预测随后被融合为最终的全尺寸导线图。为引导学习,团队还设计了一种特殊的损失函数——本质上是一种评分规则——它不仅询问“你找到了导线吗?”,还问“你是否正确捕捉了它的宽度和位置?”。这种尺度与位置敏感的损失鼓励网络更紧密地匹配每根导线的真实厚度、长度和位置,远超标准评估准则。

教会网络形状与方向

即便有这些改进,原始MSHNet在处理极长且极细的导线时仍遇到困难。为了解决这一问题,作者将预测头修改为类似智能边缘检测器的结构。受经典图像处理滤波器的启发,他们将通常的方形滤波器拆分为水平和垂直分量,采用对线状强度变化特别敏感的Sobel算子。网络将其内部特征与这些边缘检测响应相乘,有效放大线状结构并抑制无关背景模式。与此同时,他们对损失函数进行了精细化,使其更加关注导线的方向。与简单惩罚角度平方误差不同,他们使用基于余弦的度量,对小的方向错误也有强烈反应,并在模型混淆水平与垂直方向时加重惩罚。这一组合帮助网络在长距离和弯曲处保持导线的连续性。

Figure 2
Figure 2.

把方法投入测试

为验证系统的实际效果,团队收集了1800张来自城市、工厂和郊区的真实带电维护场景的高分辨率图像。这些图片包含强烈光照、杂乱环境以及多种杆塔和导线类型,构成了严苛的测试集。在对图像进行适当缩放和增强后,他们训练并评估了多个模型,包括U-Net、DeepLabV3+、PSPNet、原始MSHNet以及改进版。他们衡量了三个关键指标:整体像素准确率、预测与真实导线区域的重叠程度,以及模型在尽量检出所有导线与避免误报之间的权衡。改进后的MSHNet在像素准确率上接近99.5%,并在重叠度和精确率上超过了所有其他方法,尤其在导线交叉或被金属结构部分遮挡处,表现出更干净、更连续的导线追踪效果。

对日常供电及其他领域的意义

对非专业读者来说,结论是该方法可以让计算机几乎像细心的人类检查员一样可靠地在图像中描绘出电力线路,但速度更快、规模更大。通过更好地理解细长目标的尺寸、位置和方向,系统可以触发更准确的安全警报,支持在不停电情况下进行带电作业,并帮助在故障发生前发现缺陷。相同的思路也可用于检测其他长而细的结构,例如铁路架空线或管道。随着公用事业向更智能、更自动化的电网发展,此类进展提供了一双关键的数字“眼睛”,有助于安全高效地保障供电。

引用: Zhang, D., Xie, P., Chen, H. et al. Precise segmentation method for slender power targets based on multi-scale perception and location-sensitive learning. Sci Rep 16, 4899 (2026). https://doi.org/10.1038/s41598-026-35084-6

关键词: 电力线路巡检, 图像分割, 深度学习, 基础设施监测, 计算机视觉