Clear Sky Science · pl

Rozwiązywanie problemu niezrównoważenia danych w modelowaniu awarii rzadkich i niszczycielskich zdarzeń

2026-03-05 · Powrót do spisu

Dlaczego lepsze prognozy pogody mają dla ciebie znaczenie

Kiedy poważna burza wyłącza prąd, doświadczamy tego w bardzo osobisty sposób: brak światła, brak ogrzewania, zepsute jedzenie i odcięta komunikacja. Przedsiębiorstwa energetyczne próbują przewidzieć te awarie wcześniej, aby wysłać ekipy naprawcze i zapewnić bezpieczeństwo ludziom. Jednak najsilniejsze burze są rzadkie, co oznacza, że danych o nich jest zaskakująco niewiele. W tym artykule pokazano, jak nowy rodzaj sztucznej inteligencji potrafi „wyobrazić sobie” realistyczne, rzadkie burze, wypełniając luki w zapisach i poprawiając trafność prognoz awarii wtedy, gdy jest to najważniejsze.

Wyzwanie uczenia się na podstawie rzadkich katastrof

Większość awarii zasilania powodowana jest przez pogodę, w szczególności huragany, nor’eastery, śnieżyce i burze z lodem oraz silne burze z piorunami. Zjawiska te stają się bardziej intensywne w miarę ocieplania się klimatu, nakładając dodatkowy stres na starzejącą się infrastrukturę energetyczną. Jednak najbardziej niszczycielskie burze są z definicji rzadkie. Tradycyjne narzędzia statystyczne i modele uczenia maszynowego uczą się najlepiej na podstawie licznych łagodniejszych i umiarkowanych burz, a mają trudności z kilkoma naprawdę ekstremalnymi przypadkami. To niezrównoważenie danych prowadzi do zaniżania ocen szkód właśnie wtedy, gdy przedsiębiorstwa energetyczne najbardziej potrzebują wiarygodnych wskazówek.

Nauczanie komputerów tworzenia nowych burz

Aby pokonać to niezrównoważenie, autorzy zbudowali system generujący syntetyczne burze — czyli zdarzenia tworzone przez komputer, które wyglądają i zachowują się jak prawdziwe burze, ale nie są kopiami żadnego pojedynczego przeszłego zdarzenia. Skoncentrowali się na stanie Connecticut, reprezentując każdą burzę jako siatkę 815 komórek z 19 rodzajami informacji na komórkę, w tym wiatr, opady, ciśnienie, turbulencje, roślinność i układ linii energetycznych. Najpierw pogrupowali 294 historyczne burze w 12 klastrów w oparciu o liczbę i rozmieszczenie „miejsc kłopotliwych” — lokalizacji uszkodzeń, które zespoły musiały naprawić. Rzadkie, o dużym wpływie burze znalazły się w czterech małych klastrach, które wymagały wzmocnienia danych.

Jak nowy model AI generuje realistyczne ekstremy

Rdzeń tej metody łączy dwa nowoczesne narzędzia AI. Wariacyjny autoenkoder kompresuje każdą wielowarstwową mapę burzy do niżej wymiarowej reprezentacji „utajonej”, która wciąż zachowuje istotne wzorce, na przykład silniejsze wiatry przy wybrzeżu. W tej skompresowanej przestrzeni model dyfuzji uczy się rozpoczynać od losowego szumu i stopniowo przekształcać go w realistyczną burzę, warunkując generację na wybranym klastrze stopnia awarii. System następnie przesiewa wygenerowane burze przy użyciu zestawu metryk porównujących ich statystyki z rzeczywistymi zdarzeniami — sprawdzając nie tylko pojedyncze cechy, takie jak prędkość wiatru, ale także sposób, w jaki cechy współporuszają się ze sobą, uchwycony przez wzorce korelacji. Zachowywane są jedynie syntetyczne burze, które ściśle odpowiadają fizycznemu i statystycznemu zachowaniu rzeczywistych burz w danym klastrze.

Testowanie syntetycznych burz

Następnie autorzy zadają kluczowe pytanie: czy te syntetyczne burze rzeczywiście pomagają przewidywać awarie? Trenują istniejący model predykcji awarii dwukrotnie — najpierw tylko na rzeczywistych burzach, a potem na tych samych danych wzbogaconych starannie przesiewanymi zdarzeniami syntetycznymi dla rzadkich, o dużym wpływie klastrów. Oceny dokonują przy użyciu surowego testu „leave-one-storm-out”, który imituje prognozowanie nowych, nieznanych zdarzeń. Dzięki wzbogaceniu syntetycznemu błąd strukturalny modelu spada gwałtownie, a ogólne dopasowanie się poprawia. Dla rzadkich, najbardziej niszczycielskich burz środkowy błąd średniokwadratowy zmniejsza się o około 45%, a miary umiejętności predykcyjnej, takie jak wydajność według Nash–Sutcliffe’a, wzrastają z poziomów gorszych niż odniesienie do wyraźnie użytecznego działania. Porównanie z „losowym” uzupełnieniem, które dodaje syntetyczne burze bez kontroli jakości, wykazuje znacznie mniejsze, a czasem nawet negatywne zyski, co podkreśla znaczenie rygorystycznego filtrowania.

Co to oznacza dla przyszłych burz

Mówiąc prosto, badanie pokazuje, że pozwolenie AI na wymyślanie fizycznie spójnych ekstremalnych burz — oraz selekcja tych, którym ufamy — może uczynić prognozy awarii bardziej wiarygodnymi dla zdarzeń powodujących największe szkody. Poprzez wzbogacanie skąpych danych o rzadkie, lecz niszczycielskie zjawiska pogodowe, podejście pomaga przedsiębiorstwom energetycznym lepiej przewidzieć, ile miejsc uszkodzeń napotkają i gdzie. Chociaż zaprezentowano je dla jednego stanu i jednego typu zagrożenia, ta sama strategia może być rozszerzona na pożary, powodzie i inne zagrożenia naturalne, oferując nowy sposób wzmacniania planowania infrastruktury w świecie rosnących ekstremów klimatycznych.

Cytowanie: Azizi, M., Zhang, X., Yasenpoor, T. et al. Addressing the data imbalance issue in machine learning modeling of rare and disruptive outage events. Sci Rep 16, 8876 (2026). https://doi.org/10.1038/s41598-026-41838-z

Słowa kluczowe: syntetyczne dane burzowe, predykcja awarii zasilania, modele dyfuzji, ekstremalna pogoda, niezrównoważenie danych