Clear Sky Science · fr

Sen2GF3Floods : un jeu de données de référence multi-sources pour les inondations avec annotation dual-temporelle et apprentissage actif

· Retour à l’index

Pourquoi des cartes d’inondation plus intelligentes comptent

Les inondations figurent parmi les catastrophes naturelles les plus dévastatrices, et pourtant, lorsque des rivières débordent ou que des villes sont submergées par de fortes pluies, les équipes d’urgence peinent encore à voir précisément l’étendue des eaux. Cet article présente Sen2GF3Floods, une nouvelle collection à grande échelle d’images satellite et de cartes d’inondation prêtes pour les ordinateurs, conçue pour aider l’intelligence artificielle (IA) à tracer rapidement et de manière fiable les eaux d’inondation. En combinant différents types de vues satellitaires prises avant et après les événements et en utilisant une méthode astucieuse et économique pour annoter les zones inondées, ce travail vise à rendre des cartes d’inondation de haute qualité et en temps quasi réel beaucoup plus accessibles.

Voir l’eau depuis l’espace autrement

La cartographie des inondations depuis l’espace repose depuis longtemps sur deux grandes familles de données satellitaires. Les images optiques, proches de photographies très détaillées, montrent clairement les rivières, les champs et les quartiers—mais les nuages et les pluies intenses peuvent masquer la vue précisément au moment des inondations. Les images radar, obtenues en envoyant des micro-ondes vers le sol, traversent les nuages et fonctionnent de jour comme de nuit, mais elles sont bruitées et plus difficiles à interpréter pour les humains. Les chercheurs à l’origine de Sen2GF3Floods combinent les atouts des deux approches : des images optiques claires prises avant l’inondation et des images radar acquises pendant l’événement. Les images optiques fournissent un instantané détaillé de l’apparence habituelle du paysage, tandis que les images radar révèlent où l’eau s’étend effectivement lors de la catastrophe.

Figure 1
Figure 1.

Constituer une bibliothèque riche d’événements d’inondation

Pour être utile aux techniques modernes d’IA, un jeu de données d’inondation doit être volumineux, diversifié et soigneusement annoté—et c’est exactement ce que propose Sen2GF3Floods. Il regroupe des tuiles satellitaires issues de neuf importants événements d’inondation en Chine, couvrant rivières, terres agricoles, zones urbaines et montagnes. Pour chaque site, l’équipe a collecté quatre bandes colorées du satellite optique Sentinel-2 de l’Europe et deux bandes radar de la mission chinoise Gaofen-3, toutes à 10 mètres de résolution. Ces images ont été découpées en plus de 21 000 petites tuiles exploitables par des modèles d’apprentissage automatique. Chaque tuile est accompagnée d’une carte simple indiquant quels pixels étaient inondés et lesquels ne l’étaient pas, afin que les algorithmes puissent apprendre à distinguer les eaux permanentes, les inondations temporaires, les ombres et les terres sèches.

Laisser l’ordinateur aider à décider ce que les experts doivent annoter

Un goulot d’étranglement majeur dans la création de tels jeux de données est le traçage manuel précis des contours des inondations. Pour réduire cette charge, les auteurs ont conçu une approche d’annotation dual-temporelle en trois étapes. D’abord, ils ont généré automatiquement une carte approximative des eaux permanentes à partir de l’image optique pré-inondation et une autre à partir de l’image radar post-inondation, puis ont comparé les deux pour estimer où de nouvelles eaux étaient apparues. Ensuite, des experts humains ont affiné ces cartes approximatives en s’appuyant sur des images de fond haute résolution, corrigeant les zones délicates comme les rizières et les chenaux étroits. Enfin, ils ont entraîné un réseau de segmentation—un modèle sophistiqué de reconnaissance de formes—pour prédire les inondations sur les tuiles non annotées et ont mesuré où le modèle était le plus incertain. Seules ces tuiles « difficiles », où le modèle peinait, ont été renvoyées aux experts pour un étiquetage soigné. Cette boucle d’entraînement, de mesure de l’incertitude et de correction ciblée a permis à l’équipe d’agrandir le jeu de données tout en limitant le travail manuel.

Figure 2
Figure 2.

Tester la capacité des machines à apprendre à partir des données

Avec le jeu de données constitué, les chercheurs ont évalué plusieurs modèles de segmentation d’image de pointe, dont U-Net, U-Net++, DeepLabV3+, DANet et SegFormer. Globalement, les modèles ont très bien performé, classifiant correctement la grande majorité des pixels et capturant à la fois les vastes plaines inondables et les branches fines des rivières. U-Net++ a offert le meilleur compromis global entre précision et exhaustivité. Les expériences ont aussi exploré des questions plus profondes : combien de tuiles annotées sont réellement nécessaires avant que la précision n’atteigne un plateau ? Quelles combinaisons de bandes optiques et radar fonctionnent le mieux ? Et un modèle entraîné sur le radar Gaofen-3 peut-il être transféré à un autre satellite radar, Sentinel-1, sans réentraînement complet ? Les résultats montrent que l’usage conjoint des bandes colorées et proche infrarouges optiques avec deux canaux radar produit les meilleures cartes d’inondation, que les performances se stabilisent autour d’environ mille tuiles annotées, et que les modèles entraînés sur Gaofen-3 peuvent effectivement être appliqués à Sentinel-1 avec des résultats prometteurs.

Ce que cela signifie pour la réponse aux inondations à l’avenir

En termes simples, le projet Sen2GF3Floods fournit un « terrain d’entraînement » de haute qualité pour les IA détectant les inondations. En fusionnant des vues nettes du paysage prises avant une inondation avec des instantanés radar pris pendant l’événement, et en utilisant un schéma d’apprentissage actif qui concentre l’effort des experts là où il compte le plus, les auteurs ont construit un jeu de données permettant aux ordinateurs de reconnaître rapidement et de manière fiable les inondations sur de nombreux types de terrains. Cette base devrait aider les gestionnaires d’urgence et les scientifiques à générer des cartes d’inondation rapides et couvrant de larges surfaces avec moins de travail manuel, même lorsque les nuages obstruent le ciel ou que les données proviennent de satellites différents. À terme, étendre cette approche à davantage de villes et de régions agricoles pourrait transformer les flux satellitaires en outils pratiques, quasi temps réel, pour protéger les populations et les infrastructures contre la montée des eaux.

Citation: Chen, W., Zhu, Y., Han, W. et al. Sen2GF3Floods: A Benchmark Multi-Source Flood Dataset with Dual-Temporal and Active Learning Annotation. Sci Data 13, 540 (2026). https://doi.org/10.1038/s41597-026-06929-6

Mots-clés: cartographie des inondations, télédétection, imagerie satellite, apprentissage profond, réponse aux catastrophes