Clear Sky Science · pl
Ensemble składający się z modeli połączonych z optymalizacją Pareto dla skalowalnego wykrywania kradzieży energii elektrycznej poprzez hybrydową naprawę danych i lekkie wdrożenie
Dlaczego kradzież energii dotyczy nas wszystkich
Kradzież energii elektrycznej może brzmieć jak odległy problem, ale po cichu zwiększa rachunki za prąd, obciąża sieć i podnosi ryzyko awarii. Na całym świecie ludzie nielegalnie podłączają się do linii lub manipulują licznikami, co kosztuje przedsiębiorstwa energetyczne miliardy dolarów rocznie. W pracy tej przedstawiono nowy sposób automatycznego wykrywania takich kradzieży w ogromnych strumieniach danych ze smart meterów, mający na celu ochronę stabilności sieci i portfeli uczciwych odbiorców.
Jak inteligentne liczniki mogą pomagać i wprowadzać w błąd
Nowoczesne liczniki rejestrują zużycie energii przez gospodarstwa domowe i firmy w przekroju dni, tworząc szczegółowy obraz zapotrzebowania w czasie. W teorii nietypowe wzorce w tych zapisach mogą ujawniać kradzież, na przykład nagłe spadki deklarowanego zużycia lub dziwnie nieregularne serie odczytów. W praktyce jednak dane są nieczyste: brakuje odczytów, niektóre są uszkodzone, a uczciwych klientów jest znacznie więcej niż złodziei. Proste reguły lub starsze oprogramowanie albo przegapiają zbyt wiele przypadków kradzieży, albo generują zbyt wiele fałszywych alarmów, co utrudnia ich zaufanie w rzeczywistej eksploatacji.

Oczyszczanie wadliwych danych przed wydaniem wyroku
Badacze zaprojektowali kompletny pipeline nazwany STL-Net, który traktuje jakość danych tak samo poważnie jak końcową predykcję. Najpierw naprawia brakujące odczyty poprzez hybrydowy proces łączący kilka technik, wybierając różne metody w zależności od stopnia niekompletności poszczególnych fragmentów danych. Następnie radzi sobie z rzadkością przypadków kradzieży poprzez staranne zrównoważenie danych, tak aby algorytmy uczenia widziały wystarczająco wiele przykładów podejrzanego zachowania bez przeuczenia. Wreszcie kompresuje długie historie dziennego zużycia do mniejszego zestawu cech podsumowujących, które zachowują kluczowe wzorce, przyspieszając rozwiązanie problemu przy zachowaniu przejrzystości.
Składanie kilku inteligentnych modeli zamiast jednego czarnego pudła
Rdzeń STL-Net opiera się na podejściu zwanym stackingiem: zamiast polegać na pojedynczym modelu predykcyjnym, system trenuje kilka różnych i uczy się, jak najlepiej połączyć ich wyniki. Tutaj cztery zaawansowane modele oparte na drzewach każda szacuje prawdopodobieństwo, że klient kradnie prąd. Piąty model uczy się następnie, jak ważyć i scalać te indywidualne opinie w ostateczną decyzję. Aby uniknąć budowy nadmiernie skomplikowanego systemu, autorzy stosują strategię wyszukiwania genetycznego, która poszukuje ustawień modeli równoważących dwa cele: wysoką dokładność i niskie koszty obliczeniowe. Taka optymalizacja „Pareto” prowadzi do konfiguracji dobrych jednocześnie na obu frontach, zamiast ekstremalnych tylko w jednym aspekcie.

Wystarczająco szybkie do wdrożeń terenowych i otwarte na inspekcję
Na dużym, rzeczywistym zbiorze danych od State Grid Corporation of China, obejmującym ponad tysiąc dni zużycia dla ponad czterdziestu tysięcy klientów, STL-Net wykrywał kradzież z bardzo wysoką niezawodnością. Przewyższał szeroki zakres standardowych metod uczenia maszynowego i sieci neuronowych głębokiego uczenia, osiągając zarówno silne wyniki w poprawnym identyfikowaniu złodziei, jak i niskie wskaźniki błędnego oznaczania uczciwych użytkowników. Zespół opracował też lżejszą wersję, STL-Lite, która usuwa najwolniejszy komponent, skracając czas reakcji o około 40%, co czyni ją bardziej praktyczną dla urządzeń o ograniczonej mocy obliczeniowej przy zachowaniu niemal tej samej jakości wykrywania.
Wyjaśnianie, dlaczego system wskazuje klienta
Ponad samą dokładność, przedsiębiorstwa energetyczne i regulatorzy potrzebują zrozumieć, dlaczego system oskarża klienta o kradzież. STL-Net rozwiązuje to, stosując technikę wyjaśnialności, która przypisuje każdą decyzję najbardziej wpływowym cechom, takim jak niedawne zmiany zużycia w określonych oknach czasowych. Te wyjaśnienia pokazują, że model koncentruje się na utrzymujących się, podejrzanych przesunięciach w ostatnim zużyciu, a nie na izolowanych skokach, i pozwalają operatorom dokładniej zbadać przypadki graniczne. Ta przejrzystość pomaga zmienić model z tajemniczego czarnego pudła w narzędzie wspierające decyzje, które można audytować i któremu można zaufać.
Co to oznacza dla przyszłych rachunków i niezawodności sieci
Mówiąc prosto, badanie pokazuje, że możliwe jest zbudowanie detektora kradzieży energii, który jednocześnie jest dokładny, wydajny i wyjaśnialny. Poprzez staranną naprawę danych, zrównoważenie rzadkich przypadków kradzieży, łączenie kilku uzupełniających się modeli i kontrolowanie szybkości obliczeń, STL-Net oferuje praktyczne narzędzie dla przedsiębiorstw energetycznych. Jeśli zostanie przyjęty i dostosowany do lokalnych warunków, takie systemy mogą zmniejszyć ukryte straty, wspierać sprawiedliwsze rozliczenia i pomóc utrzymać stabilność sieci dla wszystkich jej użytkowników.
Cytowanie: Rahaman, M.A., Mohamad Idris, R. A stacking ensemble with Pareto optimization for scalable electricity theft detection via hybrid data repair and lightweight deployment. Sci Rep 16, 14548 (2026). https://doi.org/10.1038/s41598-026-39693-z
Słowa kluczowe: kradzież energii elektrycznej, inteligentne liczniki, uczenie maszynowe, modele zespołowe, bezpieczeństwo sieci energetycznej