Clear Sky Science · de
Ein Stacking-Ensemble mit Pareto-Optimierung zur skalierbaren Erkennung von Stromdiebstahl durch hybride Datenreparatur und leichtgewichtige Bereitstellung
Warum gestohlener Strom uns alle betrifft
Stromdiebstahl mag wie ein fernes Problem klingen, doch er treibt heimlich die Stromrechnungen in die Höhe, belastet das Netz und erhöht die Wahrscheinlichkeit von Ausfällen. Weltweit zapfen Personen Leitungen illegal an oder manipulieren Zähler, was Versorger jährlich Milliarden kostet. Diese Studie stellt eine neue Methode vor, um solchen Diebstahl automatisch in den riesigen Datenströmen von Smart Metern zu erkennen, mit dem Ziel, sowohl die Netzstabilität als auch die Geldbeutel ehrlicher Kunden zu schützen.
Wie Smart Meter helfen können — und irreführen
Moderne Smart Meter zeichnen auf, wie viel Strom Haushalte und Betriebe täglich verbrauchen, und erzeugen so ein detailliertes Bild der Nachfrage über die Zeit. Prinzipiell können ungewöhnliche Muster in diesen Aufzeichnungen Diebstahl verraten, etwa plötzliche Abfälle im gemeldeten Verbrauch oder auffällig unregelmäßige Ausreißer. In der Praxis sind die Daten jedoch unordentlich: Messwerte fehlen, einige sind fehlerhaft, und echte Kunden sind Dieben zahlenmäßig weit überlegen. Einfache Regeln oder ältere Software übersehen entweder zu viele Diebstähle oder lösen zu viele Fehlalarme aus, sodass sie im realen Betrieb schwer zu vertrauen sind.

Fehlerhafte Daten bereinigen, bevor man urteilt
Die Forschenden entwickelten eine vollständige Pipeline mit dem Namen STL-Net, die die Datenqualität genauso ernst nimmt wie die endgültige Vorhersage. Zuerst repariert sie fehlende Messungen durch einen hybriden Prozess, der mehrere Techniken kombiniert und je nach Ausmaß der Unvollständigkeit unterschiedliche Methoden auswählt. Anschließend geht sie das Problem an, dass Diebstahlsfälle selten sind, indem die Daten so ausbalanciert werden, dass Lernalgorithmen genug Beispiele für verdächtiges Verhalten sehen, ohne zu überanpassen. Schließlich verdichtet sie lange Zeitreihen des täglichen Verbrauchs zu einer kleineren Menge von zusammenfassenden Merkmalen, die wichtige Muster bewahren, wodurch die Aufgabe schneller lösbar und weiterhin verständlich bleibt.
Mehrere intelligente Modelle stapeln statt eine große Blackbox
Im Kern von STL-Net steht ein als Stacking bekanntes Vorgehen: Anstatt einem einzelnen Vorhersagemodell zu vertrauen, trainiert das System mehrere unterschiedliche Modelle und lernt dann, ihre Ausgaben am besten zu kombinieren. Hier schätzen vier fortgeschrittene baumbasierte Modelle jeweils die Wahrscheinlichkeit, dass ein Kunde Strom stiehlt. Ein fünftes Modell lernt anschließend, wie diese Einzelmeinungen gewichtet und zu einer finalen Entscheidung verschmolzen werden. Um ein überkomplexes System zu vermeiden, verwenden die Autorinnen und Autoren eine genetische Suchstrategie, die nach Modellkonfigurationen sucht, die zwei Ziele zugleich ausbalancieren: hohe Genauigkeit und geringe Rechenkosten. Diese Pareto-Optimierung liefert Konfigurationen, die in beiden Dimensionen gut genug sind, statt in nur einer extrem zu sein.

Schnell genug für den Einsatz und offen zur Nachprüfung
Auf einem großen realen Datensatz der State Grid Corporation of China, der mehr als tausend Tage Verbrauchsdaten für über vierzigtausend Kunden umfasst, erkannte STL-Net Diebstähle mit sehr hoher Zuverlässigkeit. Es übertraf eine breite Palette standardmäßiger Machine-Learning-Methoden und tiefer neuronaler Netze und erzielte sowohl starke Werte bei der korrekten Identifikation von Dieben als auch niedrige Raten der Fehlkennzeichnung ehrlicher Nutzer. Das Team entwickelte außerdem eine schlankere Version, STL-Lite, die die langsamste Komponente entfernt, um die Reaktionszeit um etwa 40 % zu verkürzen, was sie für Geräte mit begrenzter Rechenleistung praktikabler macht, während die Erkennungsqualität nahezu erhalten bleibt.
Nachvollziehbar machen, warum das System einen Kunden markiert
Über die reine Genauigkeit hinaus müssen Versorger und Aufsichtsbehörden verstehen, warum ein System einen Kunden des Diebstahls beschuldigt. STL-Net adressiert dies durch eine Erklärungstechnik, die jede Entscheidung den einflussreichsten Merkmalen zuordnet, etwa jüngsten Veränderungen im Verbrauch über bestimmte Zeitfenster. Diese Erklärungen zeigen, dass sich das Modell auf anhaltende, verdächtige Verschiebungen im jüngeren Verbrauch statt auf isolierte Ausreißer konzentriert, und sie ermöglichen Betreibern, Grenzfälle genauer zu prüfen. Diese Transparenz hilft, das Modell von einer mysteriösen Blackbox in ein prüfbares und vertrauenswürdiges Entscheidungsinstrument zu verwandeln.
Was das für künftige Stromrechnungen und Zuverlässigkeit bedeutet
Vereinfacht gesagt zeigt die Studie, dass es möglich ist, einen Stromdiebstahl-Detektor zu bauen, der zugleich genau, effizient und erklärbar ist. Durch sorgfältige Datenreparatur, das Ausbalancieren seltener Diebstahlsfälle, die Kombination mehrerer komplementärer Modelle und die Beachtung der Rechengeschwindigkeit bietet STL-Net ein praktikables Werkzeug für Versorger. Wenn solche Systeme übernommen und an lokale Gegebenheiten angepasst werden, könnten sie versteckte Verluste verringern, gerechtere Abrechnungen unterstützen und dazu beitragen, das Netz für alle Abhängigen stabiler zu halten.
Zitation: Rahaman, M.A., Mohamad Idris, R. A stacking ensemble with Pareto optimization for scalable electricity theft detection via hybrid data repair and lightweight deployment. Sci Rep 16, 14548 (2026). https://doi.org/10.1038/s41598-026-39693-z
Schlüsselwörter: Stromdiebstahl, Intelligente Zähler, Maschinelles Lernen, Ensemble-Modelle, Sicherheit des Smart Grids