Clear Sky Science · sv

Att hantera obalans i data vid maskininlärning för sällsynta och störande strömbortfallsincidenter

· Tillbaka till index

Varför bättre stormprognoser spelar roll för dig

När en stor storm slår ut elen upplevs det på mycket personliga sätt: inga lampor, ingen värme, förstörd mat och avbruten kommunikation. Kraftbolag försöker förutse dessa avbrott i förväg så att de kan förbereda reparationsbesättningar och hålla människor säkra. Men de allra värsta stormarna är sällsynta, vilket innebär att det finns förvånansvärt lite data om dem. Denna artikel visar hur en ny typ av artificiell intelligens kan "föreställa sig" realistiska sällsynta stormar, fylla luckorna i våra register och göra avbrottsprognoser mer precisa när det verkligen gäller.

Figure 1
Figure 1.

Utmaningen med att lära av sällsynta katastrofer

Majoriteten av strömavbrott orsakas av väder, särskilt orkaner, nor’easters, snö- och isstormar samt kraftiga åskväder. Dessa händelser blir mer intensiva i takt med att klimatet blir varmare, vilket belastar åldrande elnät extra mycket. De mest förödande stormarna är ändå, per definition, ovanliga. Traditionella statistiska verktyg och maskinlärningsmodeller lär sig bäst av de många milda och måttliga stormarna och har svårt att hantera de få riktigt extrema fallen. Denna obalans i data leder till underskattningar av skador just när kraftbolag mest behöver tillförlitlig vägledning.

Att lära datorer att skapa nya stormar

För att övervinna denna obalans bygger författarna ett system som genererar syntetiska stormar—det vill säga datorgenererade händelser som ser ut och beter sig som verkliga stormar men som inte är kopior av någon enskild tidigare händelse. De fokuserar på Connecticut och representerar varje storm som ett rutnät om 815 celler med 19 typer av information per cell, inklusive vind, regn, tryck, turbulens, vegetation och kraftledningslayout. Först grupperar de 294 historiska stormar i 12 kluster baserat på hur många och var "problemområden"—skadeplatser som reparationsbesättningar måste åtgärda—uppstod. De sällsynta, högpåverkande stormarna hamnar i fyra små kluster som behöver förstärkning.

Hur den nya AI-modellen bygger realistiska extremvärden

Kärnan i ramverket kombinerar två moderna AI-verktyg. En variational autoencoder komprimerar varje flerskiktade stormkarta till en lägre-dimensionell "latent" representation som ändå bevarar viktiga mönster, såsom starkare vindar nära kusten. I detta komprimerade utrymme lär sig en diffusionsmodell att börja från slumpmässigt brus och gradvis förädla det till en realistisk storm, betingat på vilket avbrottssvärrighetskluster som efterfrågas. Systemet granskar sedan de genererade stormarna med hjälp av ett antal mått som jämför deras statistik med verkliga händelser—kontrollerar inte bara individuella egenskaper som vindhastighet utan också hur egenskaper samvarierar, fångat genom korrelationsmönster. Endast syntetiska stormar som nära matchar det fysiska och statistiska beteendet hos verkliga stormar i ett givet kluster behålls.

Figure 2
Figure 2.

Att sätta syntetiska stormar på prov

Författarna ställer sedan den avgörande frågan: hjälper dessa syntetiska stormar faktiskt till att förutsäga avbrott? De tränar en befintlig avbrottsprognosmodell två gånger—först endast på verkliga stormar och sedan på samma data berikat med noggrant granskade syntetiska händelser för de sällsynta, högpåverkande klustren. De utvärderar prestanda med ett strikt "leave-one-storm-out"-test, vilket efterliknar prognoser för nya, osedda händelser. Med syntetisk förstärkning sjunker modellens strukturella fel kraftigt och den övergripande passformen förbättras. För de sällsynta, mest störande stormarna minskar centralt root mean squared error med cirka 45 %, och sammanfattande mått på skicklighet som Nash–Sutcliffe-effektivitet stiger från sämre-än-baslinjenivåer till tydligt användbar prestanda. En jämförelse med en "slumpmässig" augmentering, som lägger till syntetiska stormar utan kvalitetsgranskning, visar mycket mindre eller till och med negativa vinster, vilket betonar vikten av rigorös filtrering.

Vad detta betyder för framtida stormar

Enkelt uttryckt visar denna studie att låta AI uppfinna fysiskt konsistenta extrema stormar—och vara selektiv med vilka uppfunna stormar man litar på—kan göra avbrottsprognoser mer pålitliga för de händelser som orsakar störst skada. Genom att berika sparsamma data om sällsynta men förödande väderhändelser hjälper metoden kraftbolag att bättre förutse hur många skadeplatser de kommer att möta och var. Även om detta demonstrerats för en delstat och en typ av fara kan samma strategi utvidgas till skogsbränder, översvämningar och andra naturhot och erbjuda ett nytt sätt att stärka infrastrukturplaneringen i en värld med ökande klimatextremer.

Citering: Azizi, M., Zhang, X., Yasenpoor, T. et al. Addressing the data imbalance issue in machine learning modeling of rare and disruptive outage events. Sci Rep 16, 8876 (2026). https://doi.org/10.1038/s41598-026-41838-z

Nyckelord: syntetiska stormdata, förutsägelse av strömavbrott, diffusionsmodeller, extremt väder, dataobalans