Clear Sky Science · nl

Een spectrale test van het vlindereffect en fysieke consistentie in de diffusie-gebaseerde ensembles van GenCast

2026-03-18 · Terug naar het overzicht

Waarom kleine fouten in het weer ertoe doen

Weersvoorspellingen falen niet alleen doordat we onvoldoende waarnemingen hebben; ze falen ook omdat kleine fouten in de huidige atmosfeer in de loop van de tijd kunnen groeien, een idee dat vaak het vlindereffect wordt genoemd. Nu krachtige kunstmatige-intelligentie-modellen beginnen te concurreren met traditionele op fysica gebaseerde weermodellen, is het essentieel om niet alleen te kijken of deze systemen goed scoren op gebruikelijke nauwkeurigheidsmaatstaven, maar ook of ze zich gedragen als de echte atmosfeer wanneer kleine fouten groeien en zich verspreiden.

Figure 1. Vergelijking van traditionele op fysica gebaseerde weersensembles met door AI gegenereerde ensembles om te zien hoe voorspelfouten groeien en zich verspreiden.

Oude en nieuwe instrumenten voor voorspelling

Moderne weerdiensten vertrouwen op op fysica gebaseerde rekenmodellen die winden, wolken en temperatuur rond de aarde simuleren. Deze modellen, zoals het voorspellingssysteem van het Europees Centrum, draaien vele licht verschillende versies tegelijk om te laten zien hoe onzekerheid in de tijd toeneemt. Recentelijk zijn er deep-learning-weerpredictiemodellen verschenen zoals GenCast. In plaats van fysische vergelijkingen stap voor stap op te lossen, leert GenCast van tientallen jaren reanalysis-data en voegt het zorgvuldig gestructureerde ruis toe om snel grote ensembles van voorspellingen te genereren. Deze studie vraagt of deze door AI gemaakte ensembles zich op het gebied van foutverspreiding over verschillende ruimtelijke schalen gedragen als die van traditionele modellen.

Het volgen van energie over grote en kleine schalen

De auteurs richten zich op de kinetische energie van winden hoog in de atmosfeer nabij straalstromen, waar kleine verstoringen snel kunnen groeien. Ze bekijken hoe verschillen tussen ensembleleden in de loop van de tijd evolueren en hoe energie wordt verdeeld over schalen, van planetaire golven die duizenden kilometers beslaan tot mesoschaalverschijnselen van enkele honderden kilometers. In het traditionele ensemblemodel groeien kleinschalige fouten of voeden ze grotere patronen, of ze worden gedempt door fysische processen zoals turbulentie en convectie. Dit gedrag laat een karakteristieke kromme zien wanneer energie wordt uitgezet als functie van schaal, met voorspelbare hellingen in verschillende groottebereiken.

Wat het AI-model goed en fout doet

GenCast brengt enkele aspecten van dit gedrag goed in kaart. Op middelgrote schalen, geassocieerd met typische weerssystemen, lijkt de foutgroei op die van het traditionele ensemble, en de grootschalige stromingspatronen lijken op die van de referentiemodellen en reanalysis. Echter, twee belangrijke problemen komen naar voren. Ten eerste toont GenCast op de aller-grootste schalen niet de sterke foutgroei die in het op fysica gebaseerde ensemble wordt gezien, wat suggereert dat de representatie van het vlindereffect onvolledig is. Ten tweede vlakt de energiecurve op kleinere mesoschaalschalen af tot een vrijwel constante staart vanaf de eerste voorspellingstap en verandert nauwelijks in de tijd. Wanneer de wind wordt ontleed in componenten en op kaarten wordt bekeken, zien deze kleinschalige kenmerken er breed, noisy en bijna als willekeurige korrel uit in plaats van scherpe filamenten uitgelijnd met straalstromen of gevormd door bergen.

Figure 2. Hoe geïnjecteerde ruis in een AI-weermodel statische kleinschalige patronen creëert in plaats van realistische, evoluerende straalstromen en stromen.

Sporen van scherpte en terrein op kaarten

Door grote en kleine schalen te scheiden en te onderzoeken hoe ze op elkaar inwerken, vinden de auteurs dat de op fysica gebaseerde modellen duidelijke tekenen van topografie vertonen, zoals afwisselende patronen over de Andes die berggolven en weerstand op de stroming aangeven. GenCast mist deze duidelijke signalen en toont in plaats daarvan zeer brede, intense kleinschalige energie die sterk varieert tussen ensembleleden. Wanneer ze bekijken hoe snel kinetische energie ruimtelijk verandert, tonen de traditionele modellen dunne, kronkelende lijnen die straalkernen volgen, terwijl GenCast dikke, isotrope banden van noisy gradiënten produceert die nauwelijks over tien dagen evolueren. Dit suggereert dat de ruisinjectie van het AI-model variantie produceert die statistisch energetisch lijkt maar de paden van echte atmosferische dynamica niet volgt.

Waarom dit belangrijk is voor toekomstige AI-weermodellen

De studie concludeert dat GenCast vaardige voorspellingen en realistische grootschalige patronen kan produceren, maar belangrijke tests van fysieke consistentie op kleinere schalen niet doorstaat. De manier waarop ruis wordt behandeld leidt tot persistente, niet-fysische kenmerken die energie niet diffunderen of cascaderen zoals in echte atmosferische stromingen, en die de realistische spreiding van onzekerheid op planetaire schaal verzwakken. Om AI-weerpredictie een volledig betrouwbare partner van traditionele modellen te laten worden, moeten ontwikkelaars heroverwegen hoe willekeurige verstoringen worden toegevoegd en gecontroleerd, zodat ensembles niet alleen scores evenaren maar ook de fysica achter het vlindereffect respecteren.

Bronvermelding: Kim, H., Ryu, J., Son, SW. et al. A spectral test of the butterfly effect and physical consistency in the diffusion-based GenCast’s ensembles. npj Clim Atmos Sci 9, 110 (2026). https://doi.org/10.1038/s41612-026-01380-1

Trefwoorden: AI-weerforecasting, ensemblevoorspelling, vlindereffect, kinetische energiespectra, GenCast-model