Clear Sky Science · nl

Aanpasbare multi‑doeloptimalisatie van microgrid‑energiebewaking met diepe versterkingsleren, rekening houdend met batterijdegradatie en onzekerheid in hernieuwbare energie

2026-03-20 · Terug naar het overzicht

Slimmer lokaal stroombeheer voor het dagelijks leven

Nu steeds meer huizen, campusterreinen en bedrijven zonnepanelen en accu’s installeren, wordt het beheren van wanneer elektriciteit te kopen, op te slaan of te gebruiken een hoog inzetend samenspel. Goed gedaan vermindert het rekeningen en vervuiling; slecht gedaan verspilt het schone energie en slijt het dure batterijen. Deze studie onderzoekt hoe een vorm van kunstmatige intelligentie, diepe versterkingsleren genoemd, kan optreden als een "digitale bediener" voor een microgrid met zon en batterij, die dag na dag leert kosten laag te houden, meer hernieuwbare energie te gebruiken en de batterij te beschermen tegen voortijdige veroudering—zelfs wanneer de weersvoorspelling fout blijkt te zijn.

Waarom kleine elektriciteitsnetten ertoe doen

Microgrids zijn compacte stroomsystemen die zonnepanelen, batterijopslag, regelbare apparaten en een aansluiting op het grotere net samenbrengen. Ze kunnen een campus of buurt van stroom voorzien en kritische belastingen in bedrijf houden wanneer het hoofdnet onder druk staat. Maar ze zijn moeilijk te bedienen: zonlicht en vraag veranderen per minuut, elektriciteitsprijzen variëren door de dag en elke laad‑ontlaadcyclus degradeert de batterij langzaam. Traditionele regelsystemen steunen op wiskundige optimalisatie en nauwkeurige voorspellingen, die vaak falen wanneer omstandigheden afwijken van de verwachting of wanneer het systeem te complex wordt.

Een lerende regelaar die leert uit ervaring

De onderzoekers bouwden een gedetailleerde digitale tweeling van een campusgroot microgrid in het westen van Saoedi‑Arabië, inclusief 300 kW aan zonnepanelen, een grote lithium‑ionbatterij, flexibele en niet‑flexibele belastingen en een tweerichtingskoppeling met het hoofdnet. Vervolgens trainden ze een agent voor diepe versterkingsleren—specifiek een geavanceerd Deep Q‑Network—om dit virtuele systeem in stappen van 15 minuten te bedienen gedurende vele gesimuleerde jaren. De agent observeerde het batterijniveau, kortetermijnvoorspellingen voor zon en vraag, elektriciteitsprijzen en temperatuur, en koos acties zoals hoe hard de batterij te laden of ontladen en of verplaatsbare belastingen te laten draaien. Na elke stap ontving hij een beloning die drie doelen combineerde: minder betalen voor elektriciteit, batterijslijtage vertragen en minder afhankelijk zijn van fossielgestookte netstroom.

Balanceren van kosten, batterijgezondheid en schone energie

Om echte afwegingen weer te geven, verwerkten de onderzoekers een op fysica gebaseerd model voor batterijveroudering rechtstreeks in het leersignaal. De beloningsfunctie bestrafte zowel kortetermijnkosten als langetermijncapaciteitsverlies, en ontmoedigde sterk het overschrijden van veiligheidslimieten zoals overladen of te diep ontladen van de batterij. Na ongeveer 10.000 gesimuleerde dagen oefening ontdekte de agent strategieën die mensen vaak aanraden—maar die hem nooit expliciet waren aangeleerd. Hij leerde de voorkeur te geven aan vele cycli met matige diepte in plaats van enkele diepe cycli, de batterij in een middelhoog laadniveau te houden waar veroudering trager gaat, en voldoende ruimte in de batterij vrij te laten vóór zonnige periodes zodat opkomende zonne-energie kon worden opgeslagen in plaats van verspild.

Een conventionele slimme regelaar verslaan

De nieuwe op leren gebaseerde regelaar werd één‑op‑één getest tegen een sterke referentie, bekend als modelpredictieve besturing, die veel in de industrie wordt gebruikt en uitgaat van toegang tot goede voorspellingen. Over een volledig jaar aan weer‑ en vraaggegevens verlaagde het geleerde beleid de totale bedrijfskosten met ongeveer 12 procent, verminderde het capaciteitsverlies van de batterij met iets meer dan 8 procent en verhoogde het gebruik van lokaal opgewekte zonne-energie met ongeveer 10 procent. Het verminderde ook het piekvermogen dat van het net werd afgenomen en sneed de daarmee samenhangende CO2‑uitstoot met bijna 14 procent. Misschien het meest opvallend: eenmaal getraind nam de AI‑regelaar beslissingen in enkele duizendsten van een seconde—veel sneller dan de secondenlange optimalisatie van de conventionele methode—waardoor hij geschikt is voor goedkope hardware ter plaatse.

Robuust blijven wanneer het weer het laat afweten

Reële microgrids moeten omgaan met onverwachte bewolking en onvolmaakte voorspellingen. De onderzoekers testten beide regelaars met steeds onnauwkeuriger wordende zonvoorspellingen. Naarmate de foutmarges in de voorspellingen ernstig werden, stegen de kosten van de traditionele regelaar met meer dan een vijfde, terwijl de kosten van de op leren gebaseerde regelaar met minder dan een tiende toenamen. De AI‑agent ging ook beter om met snelle schommelingen in zonlicht, waarbij hij de batterij gebruikte om stroomstromen te egaliseren zonder te vervallen in schadelijke diepe ontladingen. Hij plande flexibele belastingen zo dat ze samenvielen met zonneproductie en uren met lage prijzen, waardoor de druk op het net verder afnam.

Wat dit betekent voor toekomstige energiesystemen

In alledaagse termen laat de studie zien dat een getrainde AI een zon‑en‑batterijsysteem kan beheren als een slimme operator die geeft om de rekening van vandaag, de batterijgezondheid van morgen en de klimaatimpact van elke kilowattuur. Door direct van data te leren, in plaats van te vertrouwen op perfecte voorspellingen en vereenvoudigde formules, levert de regelaar goedkopere, schonere stroom en verlengt hij de levensduur van dure batterijen. Hoewel het werk in simulatie is gedaan voor een campusmicrogrid in Saoedi‑Arabië, kan dezelfde aanpak worden aangepast aan andere locaties en worden uitgebreid naar netwerken van microgrids, wat een veelbelovende weg biedt naar veerkrachtigere, efficiëntere en duurzamere lokale energiesystemen.

Bronvermelding: Altimania, M.R.M., Basem, A., Saydullaev, B. et al. Adaptive multi-objective optimization of microgrid energy management using deep reinforcement learning considering battery degradation and renewable uncertainty. Sci Rep 16, 14296 (2026). https://doi.org/10.1038/s41598-026-44179-z

Trefwoorden: microgrids, diepe versterkingsleren, batterijgezondheid, hernieuwbare energie, energiebewaking