Clear Sky Science · ar

سلاسل أحداث الكوارث ورسوم المعرفة المستمدة من أخبار العالم باستخدام نماذج لغوية كبيرة وتوليد معزَّز بالاسترجاع

· العودة إلى الفهرس

تحويل العناوين إلى قصص مفيدة

عندما تضرب فيضان أو حريق غابات أو وباء، تتدفق تقارير الأخبار أسرع من الإحصاءات الرسمية أو الدراسات المفصّلة. مدفونة في هذه المقالات دلائل حول ما حدث، ومن تضرر أكثر، وما الإجراءات التي أفادت. تصف هذه الورقة مجموعة بيانات مفتوحة جديدة تستخدم ذكاءً اصطناعياً متقدماً لتحويل عقد من أخبار الكوارث العالمية إلى قصص منظمة وخرائط للسبب والنتيجة، مساعدة الباحثين والمخططين وخدمات الطوارئ على فهم كيفية تطور الكوارث وكيف ترتبط المخاطر.

Figure 1
Figure 1.

من الأخبار الخام إلى قصص أحداث منظمة

يبدأ المؤلفون من سجل موثوق للكوارث العالمية يُسمى EM-DAT، الذي يسرد آلاف الأحداث الكبرى حول العالم. لكل حدث بين 2014 و2024، يبحثون في أرشيف أخبار متعدد اللغات ضخم، هو منظِّم الإعلام الأوروبي، مع التركيز على التغطية باللغة الإنجليزية. باستخدام أدوات ذكاء اصطناعي حديثة، ينقّبون بين ملايين المقالات للعثور على تلك التي تتناول فعلاً فيضاناً أو زلزالاً أو موجة حر أو خطر آخر محدَّد. بقاء نسبة صغيرة فقط من المقالات المسترجعة بعد هذا التصفية، لكن المقالات التي تمر بها تزود بمعلومات غنية ومركزة عن كل حدث.

كيف يبني الذكاء الاصطناعي السرد وخرائط السبب والنتيجة

بمجرد جمع المقالات ذات الصلة، يُطلب من نموذج لغوي كبير كتابة ورقة حقائق منظمة، أو «سلسلة أحداث»، لكل كارثة. تتبع هذه الروايات قالباً واضحاً: ماذا حدث وأين، مدى شدته، المحركات الرئيسية، من وما المعرضان للخطر، الآثار الرئيسة، المخاطر المتتالية المحتملة، والإجراءات وسبل التعافي. في خطوة ثانية، يقرأ نفس النوع من النماذج سلسلة الأحداث ويستخرج بيانات بسيطة للسبب والنتيجة بصيغة ثلاثيّات مثل «الأمطار الغزيرة تسبب فيضانات مفاجئة» أو «أنظمة الإنذار المبكر تمنع الوفيات». ثم تُجمَع هذه العبارات لتشكيل رسوم معرفة—مخططات شبيهة بالشبكات تربط المخاطر والمحركات والآثار والاستجابات.

ماذا يحتوي مجموعة البيانات الجديدة

تغطي مجموعة البيانات الناتجة 3158 حدث كارثي عبر 175 دولة و26 نوعاً من المخاطر، من زلازل وعواصف إلى جفاف وأوبئة. يحتوي كل صف في ملف CSV واحد على معلومات معيارية من EM-DAT إلى جانب سلسلة الأحداث المكتوبة بالذكاء الاصطناعي والثلاثيّات المأخوذة للسبب والنتيجة. تتيح لوحة معلومات عبر الإنترنت للمستخدمين تصفح الأحداث حسب البلد والنوع ورمز الحدث، ومن ثم معاينة كلاً من السرد ورسمه المقابل. على الرغم من أن النظام يلتقط نحو نصف أحداث EM-DAT فقط خلال العقد، فإنه يشمل حوالي 80% من الخسائر الاقتصادية المبلغ عنها، مما يعكس الاهتمام الإعلامي المكثف الممنوح للكوارث الأكثر تدميراً.

Figure 2
Figure 2.

اختبار الجودة مع خبراء المجال

بما أن إدارة مخاطر الكوارث مجال يتسم بعواقب كبيرة، اختبر الفريق بعناية مدى موثوقية الرسوم المستخرجة التي أنشأها الذكاء الاصطناعي. فحص ستة خبراء ألف عبارة للسبب والنتيجة تم اختيارها عشوائياً وحكموا ما إذا كانت كل واحدة مدعومة بالنص المصدر. عموماً، تم تقييم ما يقرب من ثلثي العبارات على أنها صحيحة وفق تصويت الأغلبية، مع توافق معتدل بين الخبراء. في ورشة منفصلة، راجع نحو 30 متخصصاً في الكوارث من وكالات الحماية المدنية الأوروبية 34 رسماً كاملاً. وقعت معظم التقييمات ضمن «صحيح تماماً» أو «صحيح إلى حد كبير»، خاصة للأحداث التي لديها توثيق أفضل مثل الفيضانات والعواصف. وجدت دراسة استقصائية صغيرة عبر الإنترنت أن المشاركين اعتبروا الروايات دقيقة عموماً والرسوم مفيدة إلى حد ما لفهم المواقف المعقدة.

لماذا هذا مهم للكوارث المستقبلية

بالنسبة للجمهور العام وصانعي القرار، الرسالة الأساسية هي أن هذا المشروع يبين كيف يمكن للذكاء الاصطناعي أن يساعد في فهم تدفقات الأخبار الطاغية عن الكوارث. من خلال تحويل التقارير المتناثرة إلى قصص متسقة وخرائط بسيطة لما يؤدي إلى ماذا، تدعم مجموعة البيانات تقييمات المخاطر الأفضل، التخطيط للسيناريوهات، وتصميم الإنذار المبكر. يؤكد المؤلفون أن رسومهم ليست نماذج كاملة أو مثالية للواقع، وأن مصادر الأخبار والتحيّز نحو اللغة الإنجليزية تترك فراغات مهمة. ومع ذلك، لأن كل البيانات، والكود، والتعليمات قد نُشِرت مفتوحة، يمكن للآخرين تحسين النهج وتوسيعه وتكييفه. على المدى الطويل، قد تساعد مثل هذه الأدوات المجتمعات على الاستجابة بسرعة وبذكاء أكبر عندما تضرب الأزمة التالية.

الاستشهاد: Ronco, M., Bandelli, L., Bertolini, L. et al. Disaster Storylines and Knowledge Graphs from Global News with Large Language Models and Retrieval-Augmented Generation. Sci Data 13, 689 (2026). https://doi.org/10.1038/s41597-026-07036-2

الكلمات المفتاحية: مخاطر الكوارث, رسوم المعرفة, بيانات الأخبار, النماذج اللغوية الكبيرة, الإنذار المبكر