Clear Sky Science · es
Historias de desastres y grafos de conocimiento a partir de noticias globales con modelos de lenguaje grandes y generación aumentada por recuperación
Convertir titulares en historias útiles
Cuando ocurre una inundación, un incendio forestal o una epidemia, los informes de prensa llegan más rápido que las estadísticas oficiales o los estudios detallados. Enterradas en esos artículos hay pistas sobre lo que sucedió, quiénes fueron los más afectados y qué acciones ayudaron. Este artículo describe un nuevo conjunto de datos abierto que utiliza IA avanzada para transformar una década de noticias globales sobre desastres en relatos estructurados y mapas de causa y efecto, ayudando a investigadores, planificadores y servicios de emergencia a comprender mejor cómo se desarrollan los desastres y cómo se conectan los riesgos.

De noticias en bruto a historias de eventos estructuradas
Los autores parten de un catálogo global de desastres de confianza llamado EM-DAT, que lista miles de eventos importantes en todo el mundo. Para cada evento entre 2014 y 2024, buscan en un enorme archivo de noticias multilingüe, el Europe Media Monitor, centrando la atención en la cobertura en inglés. Empleando herramientas modernas de IA, filtran millones de artículos para encontrar aquellos que realmente tratan sobre una inundación, un terremoto, una ola de calor u otro peligro específico. Solo una pequeña fracción de los artículos recuperados sobrevive a este filtro, pero los que pasan aportan información rica y focalizada sobre cada evento.
Cómo la IA construye narrativas y mapas de causa y efecto
Una vez recopilados los artículos relevantes, se pide a un modelo de lenguaje grande que redacte una ficha estructurada de hechos, o “historia”, para cada desastre. Estas narrativas siguen una plantilla clara: qué pasó y dónde, cuán grave fue, los factores principales, quiénes y qué estuvieron expuestos, los impactos clave, posibles riesgos secundarios y las medidas de respuesta y recuperación. En un segundo paso, el mismo tipo de modelo lee la historia y extrae declaraciones simples de causa y efecto en forma de tríos como “lluvias intensas causan inundaciones repentinas” o “los sistemas de alerta temprana previenen víctimas”. Estas declaraciones se ensamblan luego en grafos de conocimiento: diagramas en red que conectan peligros, factores, impactos y respuestas.
Qué contiene el nuevo conjunto de datos
El conjunto de datos resultante abarca 3.158 eventos de desastre en 175 países y 26 tipos de peligros, desde terremotos y tormentas hasta sequías y epidemias. Cada fila en un único archivo CSV contiene información estándar de EM-DAT junto con la historia escrita por la IA y los tríos de causa y efecto extraídos. Un panel en línea permite a los usuarios examinar eventos por país, tipo y código de evento, y luego inspeccionar tanto la narrativa como su correspondiente grafo. Aunque el sistema captura solo alrededor de la mitad de todos los eventos de EM-DAT durante la década, incluye aproximadamente el 80 % de las pérdidas económicas reportadas, reflejando la intensa atención mediática prestada a los desastres más dañinos.

Evaluación de calidad con expertos del campo
Dado que la gestión del riesgo de desastres es un ámbito de alta responsabilidad, el equipo probó cuidadosamente cuán fiables son sus grafos generados por IA. Seis expertos examinaron 1.000 declaraciones de causa y efecto tomadas al azar y valoraron si cada una estaba respaldada por el texto fuente. En conjunto, casi dos tercios de las afirmaciones fueron calificadas como correctas por mayoría de votos, con un acuerdo moderado entre los expertos. En un taller separado, unos 30 profesionales de protección civil europeos revisaron 34 grafos completos. La mayoría de las valoraciones se situaron en “completamente correctas” o “mayormente correctas”, especialmente para eventos mejor documentados como inundaciones y tormentas. Una pequeña encuesta en línea encontró que los participantes en general consideraron las narrativas precisas y los grafos algo útiles para captar situaciones complejas.
Por qué esto importa para futuros desastres
Para el público general y los responsables de la toma de decisiones, el mensaje clave es que este proyecto demuestra cómo la IA puede ayudar a dar sentido a flujos abrumadores de noticias sobre desastres. Al convertir reportes dispersos en historias coherentes y en mapas sencillos de qué conduce a qué, el conjunto de datos apoya mejores evaluaciones de riesgo, planificación de escenarios y diseño de alertas tempranas. Los autores subrayan que sus grafos no son modelos perfectos ni completos de la realidad, y que las fuentes periodísticas y el sesgo hacia el inglés dejan lagunas importantes. Aun así, dado que todos los datos, el código y los prompts se comparten abiertamente, otros pueden refinar, ampliar y adaptar el enfoque. A largo plazo, tales herramientas pueden ayudar a las sociedades a responder más rápido y con mayor inteligencia cuando llegue la próxima crisis.
Cita: Ronco, M., Bandelli, L., Bertolini, L. et al. Disaster Storylines and Knowledge Graphs from Global News with Large Language Models and Retrieval-Augmented Generation. Sci Data 13, 689 (2026). https://doi.org/10.1038/s41597-026-07036-2
Palabras clave: riesgo de desastre, grafos de conocimiento, datos de noticias, modelos de lenguaje grandes, alerta temprana