Clear Sky Science · ar
فهرس عالي الدقة لحوادث الانهيارات الأرضية في الصين مبني على تنقيب نصوص الأخبار باستخدام نموذج لغوي كبير
لماذا تهمنا هذه الخريطة للانهيارات الأرضية
تُسفر الانهيارات الأرضية عن مقتل آلاف الأشخاص وتدمر المنازل والطرق والأراضي الزراعية كل عام، ومع ذلك قد يكون من الصعب العثور على معلومات أساسية حول متى وأين تحدث. تبني هذه الدراسة فهرسًا مفصلاً لأكثر من ألف انهيار أرضي في أنحاء الصين البرية عبر تعليم نظام حاسوبي على قراءة سنوات من التقارير الإخبارية. والنتيجة مجموعة بيانات عامة تساعد على تحسين أنظمة الإنذار، وتوجيه البناء الآمن، ودعم التخطيط الأفضل للكوارث.

من القصص المبعثرة إلى صورة وطنية
حتى الآن، كانت سجلات الصين للانهيارات الأرضية جزئية فقط. كانت النشرات الرسمية تعدّ عدد الحوادث السنوية أو حسب المقاطعات لكنها نادرًا ما تشتمل على مواقع أو أوقات دقيقة. ركزت الفهارس الدولية في الغالب على أعظم أو أكثر الأحداث فتكا حول العالم وغالبًا ما فوتت التقارير المحلية المكتوبة بالصينية. هذا ترك الباحثين بدون صورة واضحة ومفصلة عن الانهيارات الأرضية عبر البلاد، مما صعّب تقدير أي المنحدرات هي الأكثر خطورة أو كيف يتغير الخطر مع الوقت.
السماح للحواسيب بقراءة الأخبار
اتجه المؤلفون إلى شبكة أخبار الصين، وهي موقع إخباري وطني رئيسي ينشر تقارير على مدار الساعة من أنحاء البلاد. استخرجوا أكثر من 33,000 مقال تذكر كلمة «انهيار أرضي» من 2008 إلى 2024، ثم استبعدوا المقالات التي استُخدمت فيها الكلمة كمجاز، مثل في الانتخابات أو انهيار السوق. بعد ذلك استخدموا نموذجًا لغويًا كبيرًا، وهو نوع من الذكاء الاصطناعي المتقدم المدرب على كميات هائلة من النصوص، لاستخراج الحقائق الرئيسية من كل تقرير كارثة حقيقي. لكل حدث، حاول النظام تحديد وقت حدوثه، والمكان، وما الذي أثاره، وعدد القتلى والمصابين والمفقودين.
تنقية وفحص وتثبيت الأحداث على الخريطة
مخرجات الذكاء الاصطناعي الأولية ليست مثالية، لذا أضاف الفريق عدة طبقات من الفحص. أزالوا السجلات التي تفتقر إلى معلومات واضحة عن الزمن أو المكان، واستبعدوا التقارير التي ذكرت منطقة واسعة فقط، مثل مقاطعة، دون تفاصيل مفيدة. كما تعاملوا مع مشكلة تكرر التغطية الإعلامية لنفس الكارثة عبر مقارنة قرب الأحداث من حيث الزمن وتشابه وصف مواقعها، ثم دمجوا التكرارات المحتملة. راجع خبراء بشريون كل السجلات المتبقية وصححوا الأخطاء. ولتحويل أسماء الأماكن المكتوبة إلى إحداثيات على الخريطة، استخدم المؤلفون خدمة خرائط على الإنترنت وقواعد مخصصة لاختيار أفضل مطابق، تلتها عمليات فحص يدوية للحالات المشكوك فيها.

ما الذي يكشفه الفهرس الجديد
تتضمن مجموعة البيانات النهائية 1,582 انهيارًا أرضيًا بمعلومات دقيقة غير اعتيادية. حوالي نصف الأحداث موثقة بالساعة بالضبط أو حتى بالدقيقة، وأكثر من 80 بالمئة منها محددة على مستوى القرية أو موقع محدد مثل قطع طريق أو منحدر. تسببت الأمطار الغزيرة بمعظم الانهيارات المسجلة، خاصة في جنوب الصين، بينما تتجمع الأحداث المرتبطة بالزلازل قرب الحافة الشرقية لهضبة التبت. بالمقارنة مع قائمتين عالميتين مستخدمتين على نطاق واسع للانهيارات الأرضية، يحتوي هذا الفهرس الجديد على نحو ضعفيْن ونصف عدد الأحداث في الصين لنفس السنوات ويحدد مواقعها بدقة أكبر زمنًا ومكانيًا.
ما مدى موثوقية قراءة الذكاء الاصطناعي للأخبار
لاختبار الدقة، قارن الفريق السجلات المستخرجة بالذكاء الاصطناعي مع تقارير رسمية عن كوارث معروفة ومع مسحيات جيولوجية محلية مفصلة. وجدوا أن النظام جيد جدًا في استخلاص التفاصيل الأساسية مثل متى وأين وقع الانهيار وما الذي أثاره، لكنه أقل موثوقية في عدّ القتلى والمصابين والمفقودين، وأرقام الضحايا غالبًا ما تتغير أثناء تطور الطوارئ. عمومًا، طابقت التقارير الإخبارية نفسها إلى حد كبير المصادر الحكومية من حيث التوقيت والموقع، مما يؤكد أنها أساس موثوق لبناء مثل هذا الفهرس.
ما الذي يعنيه هذا لسلامة المستقبل
لغير المتخصصين، الرسالة الأساسية هي أن الحواسيب قادرة الآن على تصفح سنوات من التغطية الإخبارية لإنتاج خرائط واضحة ومفصلة لأماكن فشل المنحدرات الخطرة. هذا الفهرس الصيني للانهيارات الأرضية ليس سجلًا كاملاً لكل حدث، لا سيما الأحداث الصغيرة التي تركت أثرًا ضئيلاً في الإعلام، ويجب التعامل بحذر مع أرقام الضحايا. ومع ذلك، فإن دقته الزمنية والمكانية تجعله أداة قوية للعلماء الذين يختبرون نماذج الإنذار، وللمخططين الذين يقررون أماكن بناء الطرق والمدن، وللمسؤولين الذين يستعدون للعواصف والزلازل المستقبلية.
الاستشهاد: Zhao, B., Zhang, L., Liu, Z. et al. A high-precision catalogue of landslide events in China based on news text mining with large language model. Sci Data 13, 722 (2026). https://doi.org/10.1038/s41597-026-07066-w
الكلمات المفتاحية: فهرس الانهيارات الأرضية, مخاطر في الصين, تنقيب نصوص الأخبار, نموذج لغوي كبير, بيانات مخاطر الكوارث