Clear Sky Science · pt

Sen2GF3Floods: Um Conjunto de Dados de Inundações Multi-Fonte de Referência com Anotação Dual-Temporal e por Aprendizado Ativo

· Voltar ao índice

Por que mapas de inundações mais inteligentes importam

Inundações estão entre os desastres naturais mais destrutivos, mas quando rios transbordam ou cidades são alagadas por chuvas súbitas, equipes de emergência ainda têm dificuldade em ver com precisão onde a água se espalhou. Este artigo apresenta o Sen2GF3Floods, uma nova coleção em larga escala de imagens de satélite e mapas de inundação prontos para uso em computador, projetada para ajudar a inteligência artificial (IA) a localizar águas de inundação de forma rápida e confiável. Ao combinar diferentes tipos de visões de satélite obtidas antes e depois dos desastres e ao empregar uma estratégia inteligente e econômica de rotulagem das áreas alagadas, o trabalho pretende tornar mapas de inundação em tempo real e de alta qualidade muito mais acessíveis.

Ver a água do espaço de maneiras novas

O mapeamento de inundações a partir do espaço há muito depende de dois tipos principais de dados de satélite. Imagens ópticas, semelhantes a fotografias muito detalhadas, podem mostrar claramente rios, campos e quadras urbanas — mas nuvens e chuvas fortes podem bloquear a visão justamente quando as inundações ocorrem. Imagens de radar, geradas ao refletir sinais de micro-ondas no solo, conseguem ver através das nuvens e operam de dia ou de noite, mas são ruidosas e mais difíceis de interpretar por humanos. Os pesquisadores por trás do Sen2GF3Floods combinam as forças de ambos: imagens ópticas nítidas capturadas antes da inundação e imagens de radar obtidas durante o evento. As imagens ópticas fornecem um retrato detalhado de como a paisagem normalmente se apresenta, enquanto as imagens de radar revelam onde a água realmente se espalha quando o desastre acontece.

Figure 1
Figure 1.

Construindo uma biblioteca rica de eventos de inundação

Para ser útil às técnicas modernas de IA, um conjunto de dados de inundações deve ser grande, diverso e cuidadosamente rotulado — e é exatamente isso que o Sen2GF3Floods oferece. Ele reúne patches de satélite de nove grandes eventos de inundação pela China, abrangendo rios, terras agrícolas, cidades e áreas montanhosas. Para cada local, a equipe coletou quatro bandas de cor dos satélites ópticos Sentinel-2 da Europa e duas bandas de radar da missão chinesa Gaofen-3, todas com resolução de 10 metros. Essas imagens foram recortadas em mais de 21.000 pequenos tiles que os modelos de aprendizado de máquina podem processar. Cada tile vem com um mapa simples indicando quais pixels estavam inundados e quais não estavam, para que os algoritmos possam aprender as sutilezas entre água permanente, inundação temporária, sombras e terra seca.

Deixar o computador ajudar a decidir o que os especialistas devem rotular

Um grande gargalo na criação desses conjuntos de dados é traçar contornos de inundação precisos manualmente. Para reduzir esse ônus, os autores projetaram uma abordagem de anotação em três etapas e dual-temporal. Primeiro, eles geraram automaticamente um mapa bruto de água permanente a partir da imagem óptica pré-inundação e outro a partir da imagem de radar pós-inundação, depois compararam os dois para estimar onde água nova apareceu. Em seguida, especialistas humanos refinaram esses mapas brutos usando imagens de fundo de alta resolução, corrigindo áreas problemáticas como campos alagados e canais estreitos. Finalmente, eles treinaram uma rede de segmentação — um modelo sofisticado de reconhecimento de padrões — para prever inundações sobre os tiles não rotulados e mediram onde o modelo estava mais incerto. Somente esses tiles “difíceis”, onde o modelo tinha dificuldade, foram enviados de volta aos especialistas para rotulagem cuidadosa. Esse ciclo de treinamento, medição de incerteza e correção direcionada permitiu à equipe ampliar o conjunto de dados mantendo o trabalho manual sob controle.

Figure 2
Figure 2.

Testando o quanto as máquinas aprendem com os dados

Com o conjunto de dados montado, os pesquisadores avaliaram vários modelos de segmentação de imagem de ponta, incluindo U-Net, U-Net++, DeepLabV3+, DANet e SegFormer. No geral, os modelos se saíram muito bem, classificando corretamente a grande maioria dos pixels e capturando tanto planícies de inundação amplas quanto ramificações finas de rios. O U-Net++ forneceu o melhor equilíbrio geral entre acurácia e completude. Os experimentos também investigaram questões mais profundas: quantos tiles rotulados são realmente necessários antes que a acurácia pare de melhorar significativamente? Quais combinações de bandas ópticas e de radar funcionam melhor? E um modelo treinado no radar Gaofen-3 pode ser transferido para outro satélite radar, o Sentinel-1, sem ser retrenado do zero? Os resultados mostram que usar bandas ópticas de cor e no infravermelho próximo em conjunto com canais duplos de radar produz os mapas de inundação mais robustos, que o desempenho tende a estabilizar-se quando há por volta de mil tiles rotulados disponíveis, e que modelos treinados no Gaofen-3 podem, de fato, ser aplicados ao Sentinel-1 com resultados promissores.

O que isso significa para a resposta a inundações no futuro

Em termos simples, o projeto Sen2GF3Floods oferece uma “academia” de treinamento de alta qualidade para IA que detecta inundações. Ao fundir visões claras da paisagem antes da inundação com instantâneos de radar feitos durante o evento e ao empregar um esquema de aprendizado ativo que concentra o esforço dos especialistas onde ele mais importa, os autores construíram um conjunto de dados que permite aos computadores reconhecer inundações de forma rápida e confiável em muitos tipos de terreno. Essa base deve ajudar gestores de emergência e cientistas a gerar mapas de inundação rápidos e de larga escala com menos trabalho manual, mesmo quando nuvens bloqueiam o céu ou quando os dados precisam vir de diferentes satélites. Ao longo do tempo, expandir essa abordagem para mais cidades e regiões agrícolas pode transformar fluxos de satélite em ferramentas práticas e quase em tempo real para proteger pessoas e infraestrutura contra o aumento das águas.

Citação: Chen, W., Zhu, Y., Han, W. et al. Sen2GF3Floods: A Benchmark Multi-Source Flood Dataset with Dual-Temporal and Active Learning Annotation. Sci Data 13, 540 (2026). https://doi.org/10.1038/s41597-026-06929-6

Palavras-chave: mapeamento de inundações, sensoriamento remoto, imagens de satélite, aprendizado profundo, resposta a desastres