Clear Sky Science · nl
Sen2GF3Floods: Een benchmark multi-bron overstromingsdataset met dubbel-temporale en active-learning annotatie
Waarom slimmere overstromingskaarten ertoe doen
Overstromingen behoren tot de meest verwoestende natuurrampen, maar wanneer rivieren buiten hun oevers treden of steden door plotselinge regen onderlopen, hebben hulpdiensten vaak nog steeds moeite om nauwkeurig te zien waar het water zich heeft verspreid. Dit artikel presenteert Sen2GF3Floods, een nieuwe, grootschalige verzameling satellietbeelden en computerklare overstromingskaarten die bedoeld is om kunstmatige intelligentie (AI) snel en betrouwbaar watermassa’s te laten traceren. Door verschillende soorten satellietwaarnemingen vóór en na rampen te combineren en een slimme, kostenbesparende manier te gebruiken om overstroomde gebieden te labelen, beoogt dit werk real-time, hoogwaardige overstromingskaarten veel toegankelijker te maken.
Water vanuit de ruimte op nieuwe manieren waarnemen
Het in kaart brengen van overstromingen vanuit de ruimte baseert zich al langer op twee hoofdtypen satellietdata. Optische beelden, vergelijkbaar met zeer gedetailleerde foto’s, kunnen rivieren, velden en stadsblokken duidelijk laten zien — maar wolken en hevige regen kunnen het zicht juist belemmeren wanneer overstromingen plaatsvinden. Radarbeelden, gemaakt door microgolfsignalen op de grond te laten terugkaatsen, kunnen door wolken heen kijken en werken dag en nacht, maar ze zijn ruisachtiger en moeilijker voor mensen te interpreteren. De onderzoekers achter Sen2GF3Floods combineren de sterke punten van beide: heldere optische beelden gemaakt vóór een overstroming en radarbeelden vastgelegd tijdens de overstroming. De optische foto’s geven een gedetailleerde weergave van hoe het landschap er normaal uitziet, terwijl de radarbeelden laten zien waar het water zich daadwerkelijk verspreidt als de ramp toeslaat.

Een rijke bibliotheek van overstromingsgebeurtenissen opbouwen
Om nuttig te zijn voor moderne AI-technieken moet een overstromingsdataset groot, divers en zorgvuldig gelabeld zijn — en precies dat biedt Sen2GF3Floods. Het verzamelt satellietpatches van negen grote overstromingsgebeurtenissen in China, variërend van rivieren en landbouwgebieden tot steden en bergen. Voor elke locatie verzamelde het team vier kleurkanalen van Europa’s Sentinel-2 optische satellieten en twee radarkanalen van China’s Gaofen-3 missie, allemaal met een resolutie van 10 meter. Deze beelden werden opgesneden in meer dan 21.000 kleine tegels die machine-learningmodellen kunnen verwerken. Elke tegel wordt geleverd met een eenvoudige kaart die aangeeft welke pixels overstroomd waren en welke niet, zodat algoritmen de subtiele verschillen kunnen leren tussen normaal water, tijdelijke overstroming, schaduwen en droog land.
Het de computer laten beslissen wat experts moeten labelen
Een belangrijke knelpost bij het maken van zulke datasets is het handmatig tekenen van nauwkeurige overstromingscontouren. Om deze last te verminderen ontwierpen de auteurs een driefasige, dubbel-temporele annotatie-aanpak. Eerst genereerden ze automatisch een ruwe kaart van permanent water uit het optische beeld vóór de overstroming en een andere uit het radarbeeld ná de overstroming, en vergeleken die om te schatten waar nieuw water verschenen was. Vervolgens hebben menselijke experts deze ruwe kaarten verfijnd met behulp van hoge-resolutie achtergrondbeelden, waarbij ze lastige gebieden corrigeerden zoals rijstvelden en smalle kanalen. Ten slotte trainden ze een segmentatienetwerk — een geavanceerd patroonherkenningsmodel — om overstromingen over de niet-gelabelde tegels te voorspellen en gemeten waar het model het meest onzeker was. Alleen die "moeilijke" tegels, waar het model worstelde, werden teruggestuurd naar experts voor zorgvuldige labeling. Deze lus van trainen, onzekerheid meten en gerichte correctie stelde het team in staat de dataset uit te breiden terwijl het handmatige werk binnen de perken bleef.

Testen hoe goed machines van de data leren
Met de dataset samengesteld evalueerden de onderzoekers verschillende toonaangevende beeldsegmentatiemodellen, waaronder U-Net, U-Net++, DeepLabV3+, DANet en SegFormer. Over het geheel genomen presteerden de modellen zeer goed: ze classificeerden het overgrote deel van de pixels correct en vingen zowel brede overstromingsvlakten als fijne riviervertakkingen. U-Net++ bood de beste algehele balans tussen nauwkeurigheid en volledigheid. Experimenten onderzochten ook diepere vragen: hoeveel gelabelde tegels zijn echt nodig voordat de nauwkeurigheid niet veel meer verbetert? Welke combinaties van optische en radarbanden werken het beste? En kan een model dat op Gaofen-3 radar is getraind worden overgedragen naar een andere radartsatelliet, Sentinel-1, zonder helemaal opnieuw te trainen? De resultaten tonen dat het gebruik van zowel kleur- als nabij-infrarood optische banden samen met dubbele radarkanalen de sterkste overstromingskaarten oplevert, dat de prestaties afvlakken zodra er rond de duizend gelabelde tegels beschikbaar zijn, en dat modellen die op Gaofen-3 zijn getraind zich inderdaad veelbelovend op Sentinel-1 laten toepassen.
Wat dit betekent voor toekomstige overstromingsbestrijding
Simpel gezegd levert het Sen2GF3Floods-project een hoogwaardige "trainingszaal" voor AI die overstromingen detecteert. Door heldere voor-flood weergaven van het landschap te combineren met radarmomentopnames tijdens het evenement, en door een active-learning schema te gebruiken dat de expertise richt op de plekken waar het het meest nodig is, hebben de auteurs een dataset opgebouwd waarmee computers snel en betrouwbaar overstromingen kunnen herkennen in uiteenlopende terreinen. Deze basis zou hulpverleners en wetenschappers moeten helpen om snel en over grote gebieden overstromingskaarten te genereren met minder handmatig werk, zelfs wanneer wolken de lucht blokkeren of wanneer gegevens van verschillende satellieten moeten komen. Na verloop van tijd kan het uitbreiden van deze aanpak naar meer steden en landbouwstreken satellietstromen omzetten in praktische, bijna real-time hulpmiddelen om mensen en infrastructuur tegen stijgend water te beschermen.
Bronvermelding: Chen, W., Zhu, Y., Han, W. et al. Sen2GF3Floods: A Benchmark Multi-Source Flood Dataset with Dual-Temporal and Active Learning Annotation. Sci Data 13, 540 (2026). https://doi.org/10.1038/s41597-026-06929-6
Trefwoorden: overstromingskaarten, verre sensing, satellietbeelden, deep learning, rampenhulp