Clear Sky Science · ar
معالجة مشكلة عدم توازن البيانات في نمذجة التعلم الآلي لحالات الانقطاع النادرة والمفاجئة
لماذا تهمك توقعات العواصف الأفضل
عندما تتسبب عاصفة كبيرة في انقطاع التيار، نختبر ذلك بطرق شخصية للغاية: لا أضواء، لا تدفئة، طعام فاسد، وانقطاع في وسائل الاتصال. تحاول شركات المرافق التنبؤ بهذه الانقطاعات مسبقًا حتى تتمكن من تجهيز فرق الإصلاح وحماية الناس. لكن أسوأ العواصف نادر الحدوث، ما يعني وجود بيانات قليلة بشكل مفاجئ عنها. تُظهر هذه الورقة كيف يمكن لنوع جديد من الذكاء الاصطناعي أن "يتخيّل" عواصف نادرة واقعية، مملوءًا الثغرات في سجلاتنا ويجعل توقعات الانقطاع أكثر دقة عندما تكون الحاجة أكبر.

التحدي المتمثل في التعلم من الكوارث النادرة
تُسبب معظم انقطاعات التيار بالطقس، وخاصة الأعاصير، وعواصف الشمال الشرقي (Nor’easters)، وعواصف الثلج والجليد، والعواصف الرعدية الشديدة. تزداد حدة هذه الأحداث مع احترار المناخ، مما يضع ضغوطًا إضافية على شبكات الكهرباء القديمة. ومع ذلك، فإن العواصف الأكثر تدميراً نادرة بالضرورة. تميل الأدوات الإحصائية التقليدية ونماذج التعلم الآلي إلى التعلم بشكل أفضل من العديد من العواصف الخفيفة والمعتدلة، وتكافح مع الحالات القليلة الحدوث الشديدة حقًا. يؤدي هذا الاختلال في البيانات إلى تقديرات منخفضة للأضرار تمامًا عندما تحتاج شركات المرافق إلى إرشاد موثوق.
تعليم الحواسيب على إنشاء عواصف جديدة
لتجاوز هذا الاختلال، يبني المؤلفون نظامًا يولد عواصف تركيبية—أي أحداثًا أنشأها الحاسوب تبدو وتتصرف مثل العواصف الحقيقية لكنها ليست نسخًا من حدث سابق بعينه. يركزون على ولاية كونيكتيكت، ويمثلون كل عاصفة كشبكة من 815 خلية مع 19 نوعًا من المعلومات في كل خلية، بما في ذلك الرياح، المطر، الضغط، الاضطراب، الغطاء النباتي، وتخطيط خطوط الكهرباء. أولًا، يجمعون 294 عاصفة تاريخية في 12 عنقودًا استنادًا إلى عدد ومواقع "نقاط المتاعب"—مواقع الضرر التي يجب على الفرق إصلاحها. تقع العواصف النادرة عالية التأثير في أربعة عنقودات صغيرة تحتاج إلى تعزيز.
كيف يبني نموذج الذكاء الاصطناعي الجديد تطرفات واقعية
يجمع جوهر الإطار بين أداتين حديثتين في الذكاء الاصطناعي. يضغط مُشفر التباين (variational autoencoder) كل خريطة عاصفة متعددة الطبقات إلى تمثيل "كامن" منخفض الأبعاد يحافظ على الأنماط المهمة، مثل رياح أقوى قرب الساحل. في هذا الفضاء المضغوط، يتعلم نموذج الانتشار أن يبدأ من ضوضاء عشوائية ويُحسِّنها تدريجيًا إلى عاصفة واقعية، بشرط أن يكون قد طُلب عنه عنقود شدة انقطاع محدد. ثم يفحص النظام العواصف المولدة باستخدام مجموعة من المقاييس التي تقارن إحصاءاتها بالأحداث الحقيقية—فلا يفحص فقط ميزات فردية مثل سرعة الرياح بل أيضًا كيف تتحرك الميزات معًا، كما تلتقطها أنماط الارتباط. تُحتفظ فقط بالعواصف التركيبية التي تطابق سلوك العواصف الحقيقية الفيزيائي والإحصائي في عنقود معين.

وضع العواصف التركيبية على المحك
ثم يطرح المؤلفون السؤال الحاسم: هل تساعد هذه العواصف التركيبية فعلاً في التنبؤ بالانقطاعات؟ يدربون نموذج تنبؤ الانقطاع القائم مرتين—أولًا على العواصف الحقيقية فقط، ثم على نفس البيانات معززة بأحداث تركيبية مُفلترة بعناية للعناقيد النادرة عالية التأثير. يقيمون الأداء باستخدام اختبار صارم "استبعاد عاصفة واحدة"، الذي يحاكي توقع أحداث جديدة غير مرئية سابقًا. مع الإثراء التركيبِي، ينخفض خطأ البنية للنموذج بشكل حاد وتتحسن الملاءمة العامة. بالنسبة للعواصف النادرة الأكثر تدميرًا، ينخفض الجذر التربيعي المتوسط للخطأ المركزي بنحو 45%، وترتفع مقاييس المهارة الملخصة مثل كفاءة ناش–ساتكليف من مستويات أسوأ من الأساس إلى أداء مفيد بوضوح. تُظهر مقارنة مع تعزيز "عشوائي"، الذي يضيف عواصف تركيبية دون فحص الجودة، مكاسب أصغر بكثير أو حتى سلبية، مما يؤكد أهمية التصفية الصارمة.
ماذا يعني هذا للعواصف المستقبلية
بعبارات بسيطة، تُظهر هذه الدراسة أن السماح للذكاء الاصطناعي بابتكار عواصف شديدة متسقة فيزيائيًا—والانتقائية بشأن العواصف المختارة—يمكن أن يجعل توقعات الانقطاع أكثر موثوقية للأحداث التي تسبب أكبر الأضرار. من خلال إثراء البيانات النادرة عن الطقس المدمر، يساعد النهج شركات المرافق على توقع عدد مواقع الضرر التي سيواجهونها وأين ستكون. على الرغم من أنه تم توضيحه لولاية واحدة ونوع واحد من المخاطر، يمكن توسيع الاستراتيجية نفسها لتشمل الحرائق البرية والفيضانات وتهديدات طبيعية أخرى، مما يوفر طريقة جديدة لتعزيز تخطيط البنية التحتية في عالم تتصاعد فيه تطرفات المناخ.
الاستشهاد: Azizi, M., Zhang, X., Yasenpoor, T. et al. Addressing the data imbalance issue in machine learning modeling of rare and disruptive outage events. Sci Rep 16, 8876 (2026). https://doi.org/10.1038/s41598-026-41838-z
الكلمات المفتاحية: بيانات عاصفة تركيبية, تنبؤ انقطاع التيار, نماذج الانتشار, طقس قاسٍ, اختلال توازن البيانات