Clear Sky Science · pl
Scenariusze katastrof i grafy wiedzy z doniesień światowych za pomocą dużych modeli językowych i generacji wspomaganej wyszukiwaniem
Przekształcanie nagłówków w użyteczne opowieści
Kiedy nadchodzi powódź, pożar lasu czy epidemia, doniesienia medialne pojawiają się szybciej niż oficjalne statystyki czy szczegółowe opracowania. W tych artykułach ukryte są wskazówki o tym, co się stało, kto ucierpiał najbardziej i jakie działania okazały się skuteczne. W artykule opisano nowy, otwarty zestaw danych, który wykorzystuje zaawansowaną sztuczną inteligencję do przekształcenia dekady światowych doniesień o katastrofach w uporządkowane opowieści i mapy przyczynowo-skutkowe, pomagając badaczom, planistom i służbom ratunkowym lepiej rozumieć, jak rozwijają się katastrofy i jak powiązane są ryzyka.

Od surowych wiadomości do uporządkowanych relacji o zdarzeniach
Autorzy zaczynają od zaufanego, globalnego katalogu katastrof EM-DAT, który zawiera tysiące znaczących zdarzeń na całym świecie. Dla każdego zdarzenia z lat 2014–2024 przeszukują obszerny wielojęzyczny archiwum wiadomości, Europe Media Monitor, koncentrując się na materiałach w języku angielskim. Korzystając z nowoczesnych narzędzi AI, przesiewają miliony artykułów, by znaleźć te, które rzeczywiście odnoszą się do konkretnej powodzi, trzęsienia ziemi, fali upałów lub innego zagrożenia. Przetrwa tylko niewielka część pobranych artykułów, ale te, które zostaną wybrane, dostarczają bogatych, skoncentrowanych informacji o każdym zdarzeniu.
Jak AI tworzy narracje i mapy przyczynowo-skutkowe
Gdy zebrane zostaną odpowiednie artykuły, duży model językowy proszony jest o napisanie uporządkowanej karty informacyjnej, czyli „scenariusza” dla każdej katastrofy. Te narracje podążają za przejrzystym szablonem: co i gdzie się stało, jak poważne były skutki, główne czynniki napędzające zdarzenie, kto i co było narażone, kluczowe skutki, możliwe następne ryzyka oraz działania reagowania i odbudowy. W drugim kroku ten sam typ modelu czyta scenariusz i wyciąga proste stwierdzenia przyczynowo-skutkowe w formie trójek, takich jak „intensywne opady powodują gwałtowne powodzie” czy „systemy wczesnego ostrzegania zapobiegają ofiarom”. Te stwierdzenia są następnie składane w grafy wiedzy — diagramy sieciowe łączące zagrożenia, czynniki, skutki i działania.
Co zawiera nowy zestaw danych
Otrzymany zestaw danych obejmuje 3 158 zdarzeń katastroficznych w 175 krajach i 26 typów zagrożeń, od trzęsień ziemi i sztormów po susze i epidemie. Każdy wiersz w pojedynczym pliku CSV zawiera standardowe informacje z EM-DAT oraz scenariusz napisany przez AI i wyekstrahowane trójki przyczynowo-skutkowe. Interaktywny pulpit online pozwala użytkownikom przeglądać zdarzenia według kraju, typu i kodu zdarzenia, a następnie wglądać zarówno w narrację, jak i odpowiadający jej graf. Chociaż system obejmuje jedynie około połowy wszystkich zdarzeń z EM-DAT w badanej dekadzie, zawiera około 80% zgłoszonych strat ekonomicznych, co odzwierciedla intensywną uwagę mediów poświęcaną najbardziej niszczycielskim katastrofom.

Testowanie jakości z udziałem ekspertów
Ponieważ zarządzanie ryzykiem katastrof to obszar o wysokiej stawce, zespół starannie przetestował wiarygodność swoich grafów generowanych przez AI. Sześciu ekspertów przeanalizowało 1 000 losowo wybranych stwierdzeń przyczynowo-skutkowych i oceniali, czy każde z nich jest poparte tekstem źródłowym. Ogólnie prawie dwie trzecie stwierdzeń zostało ocenionych jako poprawne przez większość głosów, przy umiarkowanej zgodności między ekspertami. W odrębnym warsztacie około 30 fachowców od zarządzania kryzysowego z europejskich agencji ochrony cywilnej przejrzało 34 pełne grafy. Większość ocen mieściła się w kategorii „w pełni poprawne” lub „głównie poprawne”, zwłaszcza dla lepiej udokumentowanych zdarzeń, takich jak powodzie i sztormy. Mała ankieta online wykazała, że uczestnicy generalnie uznali narracje za dokładne, a grafy za w pewnym stopniu przydatne do zrozumienia złożonych sytuacji.
Dlaczego to ma znaczenie dla przyszłych katastrof
Dla szerokiej publiczności i decydentów kluczowy wniosek jest taki, że projekt pokazuje, jak AI może pomóc uporządkować przytłaczające strumienie doniesień o katastrofach. Przekształcając rozproszone relacje w spójne opowieści i proste mapy zależności przyczynowo-skutkowych, zestaw danych wspiera lepsze oceny ryzyka, planowanie scenariuszy i projektowanie systemów wczesnego ostrzegania. Autorzy podkreślają, że ich grafy nie są doskonałymi ani kompletnymi modelami rzeczywistości, a źródła prasowe i anglojęzyczny bias pozostawiają istotne luki. Mimo to, ponieważ wszystkie dane, kod i zapytania (prompty) są otwarcie udostępnione, inni mogą dopracować, rozszerzyć i dostosować podejście. W dłuższej perspektywie takie narzędzia mogą pomóc społeczeństwom reagować szybciej i mądrzej, gdy nadejdzie kolejny kryzys.
Cytowanie: Ronco, M., Bandelli, L., Bertolini, L. et al. Disaster Storylines and Knowledge Graphs from Global News with Large Language Models and Retrieval-Augmented Generation. Sci Data 13, 689 (2026). https://doi.org/10.1038/s41597-026-07036-2
Słowa kluczowe: ryzyko katastrof, grafy wiedzy, dane z mediów, duże modele językowe, wczesne ostrzeganie