Clear Sky Science · sv
Effektiv målupptäckningsmetod baserad på wavelettransform och progressivt feature-pyramidnätverk: en fallstudie av elnätsinspektion
Hålla kraftledningarna fria från dolda faror
El försörjer det moderna livet, men kraftledningarna som transporterar den är mer sårbara än de ser ut. Vardagsföremål som ballonger, drakar, plastpåsar eller fågelbon kan trassla in sig i högspänningsledningar och orsaka gnistor, avbrott och kostsamma reparationer. Kraftbolag förlitar sig i allt större utsträckning på drönare och kameror för att patrullera långa ledsträckor, men att upptäcka små, lågkontrastföremål i röriga bilder är fortfarande svårt både för människor och vanliga AI-system. Denna studie presenterar en snabbare, mer exakt datorseendemetod som hjälper inspektionsteam att automatiskt upptäcka dessa faror i realtid.

Varför små objekt är svåra att upptäcka
Bilder från kraftkorridorer är visuellt luriga. Det mesta av scenen utgörs av stora, jämna områden som himmel, fält eller floder, medan de säkerhetskritiska delarna – kablar, isolatorer och främmande föremål – är tunna linjer eller små fläckar. Standarddetekteringssystem som YOLO, en populär familj av realtidsdetektorer, är designade för vardagsfotografier med större, tydligare objekt som människor eller bilar. I luftbilder över kraftledningar kan dock en ballong eller en pappersbit bara täcka några få pixlar och ofta smälta in i torn eller trådar. Resultatet blir frekventa missar, falsklarm på bakgrundsstrukturer och instabil prestanda när scenerna blir komplexa.
Lära AI att läsa bilder via frekvens
Författarna angriper detta genom att ändra hur neuronnätet ”ser” på bilder. Istället för att bearbeta allt enbart i den vanliga pixelrutnätet lägger de till ett wavelet-baserat konvolutionslager kallat WTConv. Wavelets delar upp en bild i lågfrekventa komponenter som fångar jämna bakgrundsområden och högfrekventa komponenter som framhäver kanter och fina detaljer. I denna arkitektur bearbetar nätverket dessa delar separat för att sedan slå ihop dem utan informationsförlust. Det gör att det kan behålla den breda korridorernas kontext samtidigt som det skärper upp strukturer som ledningar, torn och små främmande föremål – utan att göra modellen tyngre eller långsammare.
Stapla funktioner för att se över skalor
Att upptäcka ett fågelbo på en tornarm eller en drake intrasslad i flera ledningar kräver också förståelse för hur mönster relaterar över olika storlekar i bilden. För att hantera detta introducerar studien ett Progressive Feature Pyramid Network (PFPN). Det tar funktioner från grunda och djupa lager i nätverket och fusionerar dem i två steg: först från grovt till fint, sedan tillbaka från fint till grovt. Ett ”adaptivt fusion”-steg lär sig, för varje position, hur mycket förtroende som ska ges åt varje skala. Denna progressiva stapling ger feature-kartor som ligger bättre i linje med de verkliga främmande föremålen och minskar förvirring när små faror överlappar stora metallstrukturer.

Finjustera hur rutor ritas
Även när en modell gissar rätt objekt måste den fortfarande placera en precis ruta runt det. Vanliga träningsregler fokuserar på hur mycket de predikterade och verkliga rutorna överlappar, men det kan vara missvisande för små, svaga mål. Forskarna förfinar detta steg med en ny ”Inner-EIoU”-förlust, som ägnar särskild uppmärksamhet åt hur väl rutornas centrala områden stämmer överens. Genom att belöna tät uppriktning i kärnområdet hjälper metoden modellen att låsa fast den verkliga positionen hos små eller delvis dolda främmande föremål, vilket gör de slutliga detektionerna mer pålitliga.
Bevisa förbättringarna i verkligheten
För att testa sin design byggde teamet en specialiserad datamängd med 4 700 bilder från riktiga högspänningskorridorer, som täcker miljöer från stad till landsbygd och märker fyra vanliga farotyper: sopor, ballonger, fågelbon och drakar. Jämfört med en standard YOLOv11-baslinje hittar den förbättrade modellen fler av dessa objekt samtidigt som den gör färre misstag, vilket höjer både precision och det övergripande detektionsresultatet. Samtidigt använder den cirka en femtedel färre parametrar och kör ungefär 18 % snabbare, vilket gör den lämpad för drönare eller edge-enheter som måste arbeta i realtid. Tester på en bred publik benchmark (MS COCO) visar liknande förbättringar, vilket tyder på att idéerna generaliserar bortom kraftledningar. I praktiska termer innebär detta att kraftbolag kan driftsätta smartare, lättare inspektionssystem som bättre upptäcker små faror innan de orsakar större problem.
Citering: Ye, J., Yuqi, B., Wendi, W. et al. Efficient target detection method based on wavelet transform and progressive feature pyramid network: a case study of power grid inspection. Sci Rep 16, 7318 (2026). https://doi.org/10.1038/s41598-026-37017-9
Nyckelord: elnätsinspektion, detektion av främmande föremål, drondäckning, realtidsdatorseende, högspänningsledningar