Clear Sky Science · es
Sen2GF3Floods: Un conjunto de referencia multifuente de inundaciones con anotación dual-temporal y aprendizaje activo
Por qué importan mapas de inundación más inteligentes
Las inundaciones están entre los desastres naturales más destructivos, y aun cuando los ríos se desbordan o las ciudades quedan anegadas por lluvias súbitas, los equipos de emergencia siguen teniendo dificultades para ver con precisión hasta dónde se ha extendido el agua. Este artículo presenta Sen2GF3Floods, una nueva colección a gran escala de imágenes satelitales y mapas de inundación listos para procesamiento por ordenador, diseñada para ayudar a la inteligencia artificial (IA) a trazar las aguas con rapidez y fiabilidad. Al combinar distintos tipos de observaciones satelitales tomadas antes y después de los desastres, y al emplear una estrategia ingeniosa y rentable para etiquetar las zonas inundadas, el trabajo pretende que mapas de inundación en tiempo real y de alta calidad estén mucho más disponibles.
Ver el agua desde el espacio de nuevas maneras
La cartografía de inundaciones desde el espacio se ha basado durante mucho tiempo en dos tipos principales de datos satelitales. Las imágenes ópticas, similares a fotografías muy detalladas, pueden mostrar con nitidez ríos, campos y manzanas urbanas, pero las nubes y las lluvias intensas pueden bloquear la vista justo cuando se producen las inundaciones. Las imágenes de radar, creadas rebotando señales de microondas en el terreno, pueden atravesar las nubes y funcionar de día o de noche, pero son ruidosas y más difíciles de interpretar por personas. Los investigadores detrás de Sen2GF3Floods combinan las fortalezas de ambos: imágenes ópticas nítidas tomadas antes de la inundación e imágenes de radar captadas durante el evento. Las imágenes ópticas ofrecen una instantánea detallada de cómo es el paisaje normalmente, mientras que las de radar revelan dónde se extiende realmente el agua cuando ocurre el desastre.

Construyendo una biblioteca rica de eventos de inundación
Para ser útil con las técnicas modernas de IA, un conjunto de datos de inundaciones debe ser grande, diverso y cuidadosamente anotado, y eso es precisamente lo que ofrece Sen2GF3Floods. Reúne fragmentos satelitales de nueve grandes eventos de inundación en China, abarcando ríos, tierras de cultivo, ciudades y zonas montañosas. Para cada ubicación, el equipo recopiló cuatro bandas de color de los satélites ópticos Sentinel-2 de Europa y dos bandas de radar de la misión Gaofen-3 de China, todas a 10 metros de resolución. Estas imágenes se dividieron en más de 21 000 pequeñas baldosas que los modelos de aprendizaje automático pueden procesar. Cada baldosa incluye un mapa sencillo que marca qué píxeles estuvieron inundados y cuáles no, de modo que los algoritmos puedan aprender las diferencias sutiles entre agua permanente, inundación temporal, sombras y terreno seco.
Dejando que el ordenador ayude a decidir qué deben etiquetar los expertos
Un gran cuello de botella al crear estos conjuntos de datos es dibujar contornos de inundación precisos a mano. Para reducir esta carga, los autores diseñaron un enfoque de anotación dual-temporal en tres pasos. Primero, generaron automáticamente un mapa aproximado de agua permanente a partir de la imagen óptica preinundación y otro a partir de la imagen de radar posinundación, y luego compararon ambos para estimar dónde apareció agua nueva. A continuación, expertos humanos refinaron esos mapas aproximados usando imágenes de fondo de alta resolución, corrigiendo áreas complicadas como arrozales y canales estrechos. Finalmente, entrenaron una red de segmentación—un modelo sofisticado de reconocimiento de patrones—para predecir inundaciones en las baldosas no anotadas y midieron dónde tenía más incertidumbre. Solo esas baldosas “difíciles”, donde el modelo fallaba, fueron devueltas a los expertos para un etiquetado cuidadoso. Este bucle de entrenamiento, medición de la incertidumbre y corrección dirigida permitió al equipo aumentar el conjunto de datos manteniendo controlado el trabajo manual.

Probar qué tan bien aprenden las máquinas a partir de los datos
Con el conjunto de datos ensamblado, los investigadores evaluaron varios modelos líderes de segmentación de imágenes, incluidos U-Net, U-Net++, DeepLabV3+, DANet y SegFormer. En general, los modelos rindieron muy bien, clasificando correctamente la gran mayoría de los píxeles y capturando tanto llanuras de inundación amplias como ramificaciones fluviales finas. U-Net++ ofreció el mejor equilibrio entre precisión y exhaustividad. Los experimentos también abordaron preguntas más profundas: ¿Cuántas baldosas anotadas son realmente necesarias antes de que la precisión deje de mejorar significativamente? ¿Qué combinaciones de bandas ópticas y de radar funcionan mejor? ¿Y puede un modelo entrenado con radar Gaofen-3 transferirse a otro satélite radar, Sentinel-1, sin volver a entrenarse desde cero? Los resultados muestran que usar conjuntamente bandas ópticas de color y del infrarrojo cercano con dos canales de radar produce los mapas de inundación más sólidos, que el rendimiento se estabiliza alrededor de mil baldosas anotadas, y que los modelos entrenados con Gaofen-3 pueden aplicarse a Sentinel-1 con resultados prometedores.
Qué significa esto para la respuesta a futuras inundaciones
En términos sencillos, el proyecto Sen2GF3Floods proporciona un “gimnasio de entrenamiento” de alta calidad para la IA detectora de inundaciones. Al fusionar vistas claras del paisaje tomadas antes de una inundación con capturas de radar tomadas durante el evento, y al usar un esquema de aprendizaje activo que concentra el esfuerzo experto donde más importa, los autores han construido un conjunto de datos que permite a los ordenadores reconocer inundaciones de forma rápida y fiable en numerosos terrenos. Esta base debería ayudar a gestores de emergencias y científicos a generar mapas de inundación rápidos y de gran extensión con menos trabajo manual, incluso cuando las nubes bloquean el cielo o cuando los datos proceden de distintos satélites. Con el tiempo, ampliar este enfoque a más ciudades y zonas agrícolas podría convertir los flujos satelitales en herramientas prácticas y casi en tiempo real para proteger a las personas y las infraestructuras frente al aumento de las aguas.
Cita: Chen, W., Zhu, Y., Han, W. et al. Sen2GF3Floods: A Benchmark Multi-Source Flood Dataset with Dual-Temporal and Active Learning Annotation. Sci Data 13, 540 (2026). https://doi.org/10.1038/s41597-026-06929-6
Palabras clave: cartografía de inundaciones, teledetección, imágenes satelitales, aprendizaje profundo, respuesta a desastres