Clear Sky Science · pl

Głębokie sieci resztkowe z konwolucyjnym wydobywaniem cech do krótkoterminowego prognozowania obciążenia

2026-01-27 · Powrót do spisu

Dlaczego jutrzejsze zużycie energii ma znaczenie już dziś

Za każdym razem, gdy przełączamy światło, przedsiębiorstwa energetyczne muszą już dysponować odpowiednią ilością energii elektrycznej. Jeśli wytworzą za mało, światła migoczą, a fabryki zatrzymują się; jeśli za dużo, marnują paliwo i pieniądze. Niniejszy artykuł analizuje nową metodę sztucznej inteligencji, która pomaga operatorom sieci prognozować, godzina po godzinie, ile energii ludzie będą potrzebować następnego dnia, w bardzo różnych klimatach — od ośnieżonego Nowego Anglii po tropikalną Malezję.

Wyzwanie zgadywania naszych dziennych potrzeb energetycznych

Krótkoterminowe prognozowanie obciążenia to zadanie przewidywania, ile energii elektrycznej będzie potrzebny regionowi od następnej godziny aż do następnego tygodnia. Te prognozy kierują kluczowymi decyzjami, takimi jak które elektrownie uruchomić, jak planować przeglądy techniczne i jak organizować handel energią. Nawet niewielka poprawa może przynieść duże oszczędności; dla dużego operatora zmniejszenie błędu prognozy o zaledwie jeden procent może zaoszczędzić miliony dolarów rocznie na kosztach paliwa. Jednak popyt na energię kształtowany jest przez wiele współzależnych czynników: porę dnia, dzień tygodnia, sezon, pogodę, święta i zmieniające się nawyki. Ujęcie wszystkich tych wzorców w sposób niezawodny jest trudne, zwłaszcza gdy systemy energetyczne stają się bardziej złożone, a warunki klimatyczne bardziej zmienne.

Ograniczenia wcześniejszych inteligentnych narzędzi prognostycznych

Naukowcy od dawna dążą do poprawy tych prognoz za pomocą modeli matematycznych, a ostatnio także uczenia głębokiego. Tradycyjne podejścia, takie jak regresja i proste sieci neuronowe, mają trudności, gdy rośnie liczba wejść, często pomijając subtelne wzorce lub przeuczając się na dane historyczne. Bardziej zaawansowane sieci mają swoje mocne i słabe strony: sieci konwolucyjne dobrze wychwytują krótkoterminowe fluktuacje w danych, ale nie długoterminowe trendy; sieci rekurencyjne, takie jak LSTM i GRU, potrafią śledzić dłuższe sekwencje, ale są wolniejsze i trudniejsze w trenowaniu; modele Transformer uchwytują złożone zależności, lecz wymagają dużej mocy obliczeniowej i mogą stać się niestabilne w miarę pogłębiania się. Popularnym kompromisem są głębokie sieci resztkowe, które dodają "skrótowe" połączenia pomagające bardzo głębokim modelom uczyć się bez załamania procesu trenowania. Jednak większość wcześniejszych projektów stosowała te resztkowe zabiegi głównie w późniejszych warstwach predykcyjnych, a nie na kluczowym wczesnym etapie, gdy surowe cechy są po raz pierwszy wydobywane.

Model dwustopniowy, który patrzy blisko i daleko

Autorzy proponują przeprojektowany system prognostyczny nazwany CNN‑Embedded Deep Residual Network. W pierwszym etapie model koncentruje się na lokalnych detalach. Przesyła przez jednowymiarowe bloki konwolucyjne niedawne historie zużycia i temperatury — od ostatnich 24 godzin po kilka miesięcy wstecz. Bloki te działają jak przesuwane okna, skanując szeregi czasowe, aby wykryć powtarzające się kształty: poranne szczyty, wieczorne skoki, spadki w weekendy czy nagłe wzrosty związane z pogodą. Krok poolingowy kompresuje każdy wykryty wzorzec do zwartego streszczenia, redukując szum przy zachowaniu najważniejszych informacji. Równolegle przetwarzane i scalane są informacje kalendarzowe, takie jak sezon, dzień tygodnia i flagi świąteczne. Dwudziestocztery małe podsieci, po jednej dla każdej godziny nadchodzącego dnia, przekształcają następnie te wzbogacone cechy w początkową 24‑godzinną prognozę.

Głębokie dopracowanie i testy na dwóch bardzo różnych sieciach

W drugim etapie ulepszona sieć resztkowa bierze tę pierwszą prognozę i ją dopracowuje. Stosy "bloków" z połączeniami skrótowymi korygują wartości godzinowe, zachowując jednocześnie realistyczny kształt dobowy i zapobiegając zatrzymaniu procesu trenowania. Zespół trenował i stroił tę architekturę na dwóch rzeczywistych zbiorach danych: ISO New England, obejmującym sześć stanów USA z wyraźnymi wahaniami sezonowymi, oraz Malezji, gdzie zużycie energii jest bardziej stabilne w tropikalnym klimacie. Porównano ich model z szerokim spektrum alternatyw, w tym z czystymi sieciami konwolucyjnymi, kilkoma sieciami rekurencyjnymi, modelem Transformer, oryginalnym projektem sieci resztkowej oraz wariantami, które dodawały jedynie część konwolucyjną lub resztkową osobno. Wydajność oceniano za pomocą powszechnych miar błędu, zwłaszcza średniego bezwzględnego błędu procentowego, oraz testowano pod kątem istotności statystycznej przy użyciu intensywnego resamplingu bootstrapowego.

Co wyniki mówią o inteligentniejszych sieciach

CNN‑Embedded Deep Residual Network konsekwentnie dostarczał najdokładniejsze prognozy. Dla danych z Nowej Anglii obniżył średni błąd procentowy do około 1,53 procent, poprawiając wyniki silnych konkurentów opartych na architekturze resztkowej nawet o około 11 procent. W Malezji, gdzie wzorce są gładsze i trudniej uzyskać poprawę, nadal zmniejszył błąd do około 5,06 procent i wyprzedził wszystkie inne modele. Testy sezonowe wykazały, że metoda radziła sobie z wiosennymi i letnimi szczytami, zimowymi obciążeniami grzewczymi oraz tropikalnymi porami deszczowymi i suchymi bez utraty dokładności. Kontrole statystyczne potwierdziły, że te ulepszenia nie były dziełem przypadku. Dla osób niebędących specjalistami wniosek jest prosty: łącząc "mikroskop" do krótkoterminowych wzorców z "kręgosłupem", który stabilizuje uczenie głębokie, podejście to oferuje operatorom sieci bardziej niezawodny sposób przewidywania jutrzejszych potrzeb energetycznych — oszczędzając pieniądze, zmniejszając marnotrawstwo i wspierając przejście do inteligentniejszych, czystszych systemów energetycznych.

Cytowanie: Liu, J., Ahmad, F.A., Samsudin, K. et al. Deep residual networks with convolutional feature extraction for short-term load forecasting. Sci Rep 16, 6382 (2026). https://doi.org/10.1038/s41598-026-35410-y

Słowa kluczowe: krótkoterminowe prognozowanie obciążenia, uczenie głębokie, sieć energetyczna, konwolucyjne sieci neuronowe, sieci resztkowe