Clear Sky Science · pl

Efektywna metoda wykrywania obiektów oparta na transformacie falkowej i progresywnej sieci piramidy cech: studium przypadku inspekcji sieci energetycznej

· Powrót do spisu

Utrzymanie linii energetycznych wolnych od ukrytych zagrożeń

Prąd zasila współczesne życie, ale linie przesyłowe, które go prowadzą, są bardziej delikatne, niż się wydaje. Codzienne przedmioty, takie jak balony, latawce, plastikowe torby czy gniazda ptaków, mogą zaplątać się na liniach wysokiego napięcia, grożąc iskrzeniem, awariami i kosztownymi naprawami. Zakłady energetyczne coraz częściej polegają na dronach i kamerach do patrolowania długich odcinków przewodów, jednak wykrywanie drobnych, niskokontrastowych obiektów na złożonych obrazach nadal stanowi wyzwanie zarówno dla ludzi, jak i dla standardowych systemów AI. W tym badaniu przedstawiono szybszą, dokładniejszą metodę wizji komputerowej, która pomaga zespołom inspekcyjnym automatycznie wykrywać te zagrożenia w czasie rzeczywistym.

Figure 1
Figure 1.

Dlaczego małe obiekty trudno dostrzec

Obrazy korytarzy energetycznych są wizualnie podchwytliwe. Większość sceny składa się z rozległych, gładkich obszarów, takich jak niebo, pola czy rzeki, podczas gdy krytyczne dla bezpieczeństwa elementy – kable, izolatory i obce obiekty – mają postać cienkich linii lub małych plam. Standardowe systemy detekcji, takie jak rodzina YOLO, zaprojektowano do zdjęć codziennych z większymi, czytelniejszymi obiektami, jak osoby czy samochody. W obrazach lotniczych linii przesyłowych balony czy skrawki śmieci mogą zajmować zaledwie kilka pikseli i często stapiają się z wieżami czy przewodami. Skutkuje to częstymi przeoczeniami, fałszywymi alarmami wywołanymi przez struktury tła i niestabilną wydajnością w zatłoczonych scenach.

Nauczanie AI „czytania” obrazu przez częstotliwości

Autorzy rozwiązują ten problem, zmieniając sposób, w jaki sieć neuronowa „patrzy” na obrazy. Zamiast przetwarzać wszystko wyłącznie w zwykłej siatce pikseli, dodają warstwę konwolucyjną opartą na falkach nazwaną WTConv. Falki rozdzielają obraz na części niskoczęstotliwościowe, które uchwytują gładkie obszary tła, oraz wysokoczęstotliwościowe, które uwydatniają krawędzie i drobne szczegóły. W tym rozwiązaniu sieć przetwarza te składniki oddzielnie, a następnie łączy je z powrotem bez utraty informacji. Oznacza to, że może śledzić szeroki kontekst korytarza, jednocześnie wyostrzając struktury takie jak przewody, wieże i drobne obce obiekty – bez zwiększania ciężaru modelu ani spowalniania działania.

Stackowanie cech, by widzieć w różnych skalach

Wykrycie gniazda ptaka na ramieniu wieży czy latawca zaplątanego na kilku przewodach wymaga także zrozumienia relacji wzorców w różnych rozmiarach obrazu. Aby temu sprostać, badanie wprowadza Progresywną Sieć Piramidy Cech (PFPN). Pobiera ona cechy z płytkich i głębokich warstw sieci i łączy je w dwóch przebiegach: najpierw od struktury grubej do drobnej, a potem z powrotem od drobnej do grubej. Krok „adaptacyjnego łączenia” uczy się, dla każdej lokalizacji, jak bardzo ufać każdej skali. To progresywne układanie daje mapy cech lepiej dopasowane do rzeczywistych obcych obiektów i zmniejsza zamieszanie, gdy małe zagrożenia zachodzą na duże metalowe struktury.

Figure 2
Figure 2.

Doprecyzowanie rysowania ramek

Nawet gdy model trafnie zidentyfikuje obiekt, nadal musi umieścić wokół niego precyzyjną ramkę. Powszechne reguły treningowe koncentrują się na tym, jak bardzo przewidziana i prawdziwa ramka zachodzą na siebie, ale to może wprowadzać w błąd przy maleńkich, słabo widocznych celach. Badacze udoskonalili ten etap za pomocą nowej funkcji straty „Inner-EIoU”, która zwraca szczególną uwagę na dopasowanie centralnych obszarów ramek. Nagradzając ścisłe wyrównanie w obszarze rdzenia, metoda pomaga modelowi uchwycić prawdziwe położenie małych lub częściowo ukrytych obcych obiektów, czyniąc końcowe wykrycia bardziej godnymi zaufania.

Udowodnienie korzyści w praktyce

Aby przetestować swój projekt, zespół zbudował wyspecjalizowany zbiór danych 4 700 obrazów z rzeczywistych korytarzy wysokiego napięcia, obejmujący sceny od miast po obszary wiejskie i oznaczając cztery powszechne typy zagrożeń: odpady, balony, gniazda ptaków i latawce. W porównaniu ze standardową bazą YOLOv11 ulepszony model wykrywa więcej takich obiektów przy jednoczesnym zmniejszeniu liczby błędów, podnosząc zarówno precyzję, jak i ogólne wyniki detekcji. Jednocześnie używa około jednej piątej mniej parametrów i działa około 18% szybciej, co czyni go dobrze dopasowanym do dronów lub urządzeń brzegowych pracujących w czasie rzeczywistym. Testy na szerokim publicznym benchmarku (MS COCO) pokazują podobne usprawnienia, co sugeruje, że pomysły te uogólniają się poza linie energetyczne. W praktyce oznacza to, że zakłady energetyczne mogą wdrażać mądrzejsze, lżejsze systemy inspekcyjne, które lepiej wykrywają małe zagrożenia, zanim spowodują poważne problemy.

Cytowanie: Ye, J., Yuqi, B., Wendi, W. et al. Efficient target detection method based on wavelet transform and progressive feature pyramid network: a case study of power grid inspection. Sci Rep 16, 7318 (2026). https://doi.org/10.1038/s41598-026-37017-9

Słowa kluczowe: inspekcja sieci energetycznej, wykrywanie obcych obiektów, obrazowanie dronem, wizja komputerowa w czasie rzeczywistym, linie przesyłowe wysokiego napięcia