Clear Sky Science · he

סיפורי אסונות וגרפי ידע מתוך חדשות עולמיות עם מודלים שפתיים גדולים והפקה מועשרת-התרשמות

· חזרה לאינדקס

להפוך כותרות לסיפורים מועילים

כאשר שיטפון, שריפה או מגפה מתרחשים, הדיווחים התקשורתיים מציפים במהירות רבה יותר מאשר סטטיסטיקות רשמיות או מחקרי עומק. בתוך מאמרים אלה טמונים רמזים על מה שאירע, מי נפגע קשה יותר ואילו פעולות סייעו. מאמר זה מתאר מערך נתונים פתוח חדש שמשתמש בבינה מלאכותית מתקדמת כדי להפוך עשור של חדשות אסון גלובליות לסיפורים מובנים ולמפות של סיבה-וסיבה, ובכך לסייע לחוקרים, מתכננים ושירותי חירום להבין טוב יותר כיצד אסונות מתפתחים וכיצד סיכונים מקושרים.

Figure 1
Figure 1.

מחדשות גולמיות לסיפורי אירועים מובנים

המחברים מתחילים ממאגר אסונות עולמי מהימן בשם EM-DAT, שמפרט אלפי אירועים משמעותיים ברחבי העולם. עבור כל אירוע בין השנים 2014 ל-2024 הם מחפשים בארכיון חדשות רב-לשוני עצום, Europe Media Monitor, עם התמקדות בכיסוי באנגלית. באמצעות כלי בינה מלאכותית מודרניים הם מסננים מיליוני מאמרים כדי למצוא את אלו שבאמת מדברים על שיטפון, רעידת אדמה, גל חום או סיכון אחר מסוים. רק חלק קטן מהמאמרים שנשלפו שורד את המסננת, אך אלו שמצליחים לספק מידע עשיר וממוקד על כל אירוע.

כיצד ה-AI בונה נרטיבים ומפות סיבה-תוצאה

לאחר איסוף המאמרים הרלוונטיים, מודל שפתי גדול מתבקש לכתוב גיליון עובדות מובנה, או "קו עלילה" לכל אסון. הנרטיבים האלה נבנים לפי תבנית ברורה: מה קרה והיכן, כמה חמור היה האירוע, הגורמים העיקריים, מי ומה היו חשופים, ההשפעות המרכזיות, סיכוני המשך אפשריים, והתגובות ואמצעי ההתאוששות. בשלב שני, אותו סוג מודל קורא את קו העלילה ומחלץ משפטי סיבה-תוצאה פשוטים בצורת טריפלים כגון "גשם כבד גורם להצפות פתאומיות" או "מערכות אזהרה מוקדמות מונעות אבדות בנפש." משפטים אלה מורכבים לאחר מכן לגרפי ידע — דיאגרמות דמויות-רשת שמחברות סיכונים, מניעים, השפעות ותגובות.

מה מכיל מערך הנתונים החדש

מערך הנתונים שנוצר מכסה 3,158 אירועי אסון ב-175 מדינות ו-26 סוגי סיכונים, מרעידות אדמה וסערות ועד בצורות ומגפות. כל שורה בקובץ CSV בודד מחזיקה מידע סטנדרטי מ-EM-DAT לצד קו העלילה שכתוב על ידי ה-AI והטריפלים של סיבה-תוצאה שנחולצו. לוח מחוונים מקוון מאפשר למשתמשים לדפדף באירועים לפי מדינה, סוג וקוד אירוע, ולאחר מכן לבחון הן את הנרטיב והן את הגרף המתאים. אף על פי שהמערכת לוכדת רק כ-חצי מכלל אירועי EM-DAT במשך העשור, היא כוללת כ-80% מההפסדים הכלכליים המדווחים, מה שמצביע על תשומת לב תקשורתית מרוכזת לאסונות המזיקים ביותר.

Figure 2
Figure 2.

בדיקת איכות עם מומחים מהתחום

מכיוון שניהול סיכוני אסון הוא תחום רגיש, הצוות בדק בקפידה עד כמה סימני הגרפים שנוצרו על ידי ה-AI מהימנים. שישה מומחים בחנו 1,000 משפטי סיבה-תוצאה שנבחרו אקראית והשפטו האם כל אחד מהם נתמך על ידי הטקסט המקורי. בסה"כ כמעט שני שלישים מהמשפטים קיבלו הערכה נכונה על-ידי רוב המומחים, עם הסכמה מתונה ביניהם. בסדנה נפרדת כ-30 אנשי מקצוע בתחום האסונות מסוכנויות הגנה אזרחית אירופאיות סקרו 34 גרפים מלאים. רוב הדירוגים נקלעו ל"נכון לחלוטין" או "נכון ברובו", במיוחד עבור אירועים המתועדים טוב יותר כמו שיטפונות וסערות. סקר מקוון קטן מצא שהמשתתפים בדרך כלל ראו את הנרטיבים כמדויקים ואת הגרפים כמועילים במידה מסוימת להבנת מצבים מורכבים.

מדוע זה חשוב עבור אסונות עתידיים

לקהל הרחב ומקבלי ההחלטות, המסר המרכזי הוא שהפרויקט מראה כיצד AI יכול לסייע לעשות סדר בזרמי חדשות אסון מציפים. על ידי המרת דיווחים מפוזרים לסיפורים עקביים ומפות פשוטות של מה מוביל למה, מערך הנתונים תומך בהערכות סיכון טובות יותר, תכנון תרחישים ועיצוב מערכות אזהרה מוקדמת. המחברים מדגישים שהגרפים שלהם אינם מושלמים או תמונת מציאות מלאה, ושמקורות חדשות והעדפה לשפה האנגלית משאירים פערים חשובים. עם זאת, מאחר שכל הנתונים, הקוד והשאילתות שותפים בפתוח, אחרים יכולים לחדד, להרחיב ולהתאים את הגישה. בטווח הארוך, כלים כאלה עלולים לסייע לחברות להגיב במהירות ובאופן חכם יותר כאשר המשבר הבא יכה.

ציטוט: Ronco, M., Bandelli, L., Bertolini, L. et al. Disaster Storylines and Knowledge Graphs from Global News with Large Language Models and Retrieval-Augmented Generation. Sci Data 13, 689 (2026). https://doi.org/10.1038/s41597-026-07036-2

מילות מפתח: סיכון אסון, גרפי ידע, נתוני חדשות, מודלים שפתיים גדולים, אזהרה מוקדמת