Clear Sky Science · pt

Enredos de Desastres e Grafos de Conhecimento a partir de Notícias Globais com Grandes Modelos de Linguagem e Geração Aumentada por Recuperação

2026-03-17 · Voltar ao índice

Transformando Manchetes em Histórias Úteis

Quando uma inundação, incêndio florestal ou epidemia ocorre, relatos jornalísticos chegam mais rápido do que estatísticas oficiais ou estudos detalhados. Enterradas nesses artigos estão pistas sobre o que aconteceu, quem foi mais afetado e quais ações ajudaram. Este artigo descreve um novo conjunto de dados aberto que usa IA avançada para transformar uma década de notícias globais sobre desastres em histórias estruturadas e mapas de causa e efeito, ajudando pesquisadores, planejadores e serviços de emergência a compreender melhor como os desastres se desenrolam e como os riscos se conectam.

Das Notícias Brutas às Histórias Estruturadas de Eventos

Os autores partem de um catálogo global de desastres confiável chamado EM-DAT, que lista milhares de eventos importantes em todo o mundo. Para cada evento entre 2014 e 2024, eles pesquisam um enorme arquivo multilíngue de notícias, o Europe Media Monitor, com foco na cobertura em inglês. Usando ferramentas de IA modernas, filtram milhões de artigos para encontrar aqueles que realmente tratam de uma enchente, terremoto, onda de calor ou outro perigo específico. Apenas uma pequena fração dos artigos recuperados sobrevive a esse filtro, mas os que permanecem fornecem informações ricas e focadas sobre cada evento.

Como a IA Constrói Narrativas e Mapas de Causa e Efeito

Uma vez coletados os artigos relevantes, um grande modelo de linguagem é solicitado a redigir uma ficha estruturada, ou “enredo”, para cada desastre. Essas narrativas seguem um modelo claro: o que aconteceu e onde, quão severo foi, os principais fatores causadores, quem e o que estavam expostos, os impactos principais, riscos subsequentes possíveis e as medidas de resposta e recuperação. Em um segundo passo, o mesmo tipo de modelo lê o enredo e extrai declarações simples de causa e efeito na forma de triplas, como “chuvas fortes causam enchentes repentinas” ou “sistemas de alerta precoce previnem vítimas”. Essas declarações são então montadas em grafos de conhecimento — diagramas em rede que conectam perigos, fatores causadores, impactos e respostas.

O que o Novo Conjunto de Dados Contém

O conjunto de dados resultante cobre 3.158 eventos de desastres em 175 países e 26 tipos de perigos, de terremotos e tempestades a secas e epidemias. Cada linha de um único arquivo CSV contém informações padrão do EM-DAT juntamente com o enredo escrito pela IA e as triplas de causa e efeito extraídas. Um painel online permite que os usuários naveguem pelos eventos por país, tipo e código do evento, e então inspecionem tanto a narrativa quanto seu grafo correspondente. Embora o sistema capture apenas cerca de metade de todos os eventos do EM-DAT ao longo da década, inclui cerca de 80% das perdas econômicas reportadas, refletindo a intensa atenção da mídia aos desastres mais danosos.

Testando a Qualidade com Especialistas da Área

Como a gestão do risco de desastres é um domínio de alto risco, a equipe testou cuidadosamente o quão confiáveis são seus grafos gerados por IA. Seis especialistas analisaram 1.000 declarações de causa e efeito amostradas aleatoriamente e julgaram se cada uma era sustentada pelo texto-fonte. No geral, quase dois terços das declarações foram avaliadas como corretas pela maioria dos votos, com concordância moderada entre os especialistas. Em um workshop separado, cerca de 30 profissionais de desastres de agências europeias de proteção civil revisaram 34 grafos completos. A maioria das avaliações caiu em “totalmente correta” ou “principalmente correta”, especialmente para eventos melhor documentados como enchentes e tempestades. Uma pequena pesquisa online constatou que os participantes, em geral, consideraram as narrativas precisas e os grafos relativamente úteis para entender situações complexas.

Por que Isso Importa para Desastres Futuros

Para o público em geral e os tomadores de decisão, a mensagem principal é que este projeto demonstra como a IA pode ajudar a dar sentido a fluxos esmagadores de notícias sobre desastres. Ao transformar relatos dispersos em histórias consistentes e mapas simples do que leva a quê, o conjunto de dados apoia melhores avaliações de risco, planejamento de cenários e desenho de alertas precoces. Os autores ressaltam que seus grafos não são modelos perfeitos ou completos da realidade, e que as fontes de notícias e o viés da cobertura em inglês deixam lacunas importantes. Ainda assim, porque todos os dados, código e prompts são compartilhados abertamente, outros podem refinar, ampliar e adaptar a abordagem. A longo prazo, tais ferramentas podem ajudar sociedades a responder mais rápido e com mais inteligência quando a próxima crise ocorrer.

Citação: Ronco, M., Bandelli, L., Bertolini, L. et al. Disaster Storylines and Knowledge Graphs from Global News with Large Language Models and Retrieval-Augmented Generation. Sci Data 13, 689 (2026). https://doi.org/10.1038/s41597-026-07036-2

Palavras-chave: risco de desastres, grafos de conhecimento, dados de notícias, grandes modelos de linguagem, alerta precoce