Clear Sky Science · ar
تطبيق شبكات عصبية عميقة المستوحاة من السرب ونماذج التجميع لإعادة بناء بيانات الموصلية النوعية
لماذا يهم سد فجوات البيانات
المياه الساحلية هي خط المواجهة حيث تتقاطع الأنشطة البشرية مع المحيط. يتتبع العلماء ملوحة هذه المياه بمقياس يُدعى الموصلية النوعية، الذي يساعد في الكشف عن تسربات التلوث، وتغيرات جريان المياه العذبة، والتحولات البيئية طويلة الأمد. لكن المستشعرات تتعطل، والعواصف تقطع التيار الكهربائي، والأجهزة لها حدود. والنتيجة هي فجوات مزعجة في سجلات أساسية—تمامًا عندما يحتاج المديرون والباحثون إلى بيانات مستمرة. تطرح هذه الدراسة سؤالاً عمليًا: هل يمكن للذكاء الاصطناعي الحديث أن «يصلح» تلك السجلات المقطوعة بشكل موثوق حتى تُبنى القرارات الساحلية على معلومات كاملة وجديرة بالثقة؟
مراقبة أنفاس الخليج
تركز الباحثون على خليج المكسيك، أحد أكبر النظم البحرية في العالم ومنطقة تتعرض لضغوط صناعية وزراعية مكثفة. استخدموا قياسات من خمسة محطات تابعة للمسح الجيولوجي الأمريكي قرب نهر باسكاجولا وبحيرة موليت، تسجل كل محطة ملوحة المياه (من خلال الموصلية النوعية)، ودرجة الحرارة، ومستوى الماء كل 15 دقيقة. كانت إحدى المحطات، المسماة E، تفتقد نحو 5% من بيانات الموصلية النوعية—نوع المشكلة الذي يواجه شبكات الرصد الحقيقية. شكلت بيانات المحطات الأربع المجاورة شبكة أمان بيئية: حتى عندما تعمى المحطة E، بقيت الأخريات ترصد. الفكرة المركزية كانت تعليم نماذج الحاسوب كيف «تتنفَّس» المحطات الخمس معًا بحيث يمكن استنتاج الفجوات في موقع واحد من سجلات مكتملة في البقية.

اختبار الخوارزميات الذكية
لمعالجة ذلك، جمع الفريق باقة من عشرة أساليب نمذجة مختلفة. في طرف كان هناك أدوات مألوفة مثل الانحدار الخطي المتعدد، التي تحاول رسم علاقات خطية بين المدخلات والمخرجات. في الوسط كانت نماذج أكثر مرونة مثل الشبكات العصبية التقليدية، وأنظمة المنطق الضبابي، وشبكة الذاكرة الطويلة القصيرة الأمد (LSTM) الخاصة بسلاسل الزمن. كما استخدموا طريقة ذاتية التنظيم تسمى طريقة مجموعة معالجة البيانات (GMDH) ونمطًا غير خطيًّا (NGMDH) يمكنه بناء صيغ متعددة الطبقات بنفسه. وأخيرًا استُخدمت طرق قائمة على الأشجار: نموذج شجرة قرار واحد (CART) واثنتان من النهج «التجميعي»—الغابة العشوائية وXGBoost—اللتان تجمعان العديد من الأشجار لاتخاذ القرار النهائي، شبيهة بلجنة من الخبراء تصوت على الإجابة.
التعلّم العميق المدعوم بالسرب
تدريب الشبكات العصبية العميقة صعب بطبعه: أزرارها ومفاتيحها العديدة قد تعلق بسهولة في تكوينات ضعيفة. لتحسينها، زوج المؤلفون LSTM وNGMDH بطريقة تحسين حديثة مستوحاة من حركة الماء الدوامية، تُسمى تحسين تدفق الماء المضطرب (TFWO). في هذا الإطار يُتخيل كل مجموعة ممكنة من معاملات النموذج كـ«جسيم» يتحرك في نمط دوّامة عبر فضاء الحلول. عبر دورات متعددة، تُدفع الجسيمات نحو مناطق تعطي أخطاء تنبؤ أصغر. هذا البحث بطريقة السرب جعل كلا نوعَي الشبكة العصبية أكثر دقة من نسخهما القياسية، وخفّض متوسط أخطائهما بنحو 6–11 بالمئة. ومع ذلك، حتى هذه النماذج العميقة المحسنة قُدِّرت بأداء أقل من طرائق الأشجار.

تقدّم النماذج التجميعية
اختبر المؤلفون جميع الأساليب بدقة في ستة سيناريوهات. في خمسة سيناريوهات «ماذا لو»، أخفوا أجزاءً من سجلات مكتملة وتحققوا من مدى نجاح كل نموذج في إعادة بناء القيم المفقودة. في الحالة الحقيقية النهائية، طلبوا من النماذج ملء الفجوات الحقيقية في المحطة E باستخدام بيانات جيرانها. عبر هذه الاختبارات، كان أبسط الأساليب الخطية الأسوأ أداءً، بينما أدت نماذج تعلم الآلة القياسية أداءً أفضل بكثير، مخفضةً الخطأ نحو النصف تقريبًا. حسّنت أشجار القرار الأداء أكثر بفضل تقسيمها التلقائي للبيانات إلى مجموعات أكثر تجانسًا. الفائز الواضح كان مجموعة XGBoost: من خلال بناء مئات الأشجار التي يصحح كل منها أخطاء سابقاتها، حققت خطأً منخفضًا للغاية وتطابقًا شبه كامل بين المقادير المتنبأ بها والمقاسة للموصلية النوعية. تابعت إعادة بنائها السلاسل الزمنية المرصودة عن قرب وأعادت إنتاج السلوك الإحصائي العام لسجلات جودة المياه.
ما معنى ذلك للسواحل وما بعدها
لغير المتخصصين، الخلاصة بسيطة: يمكن للذكاء الاصطناعي المصمم بعناية أن يملأ بثقة أجزاء مفقودة من سجلات جودة مياه السواحل، لا سيما عندما تتوفر محطات مجاورة لتوفير السياق. بينما تُعد الشبكات العصبية المتقدمة قوية، تُظهر هذه الدراسة أن طرق التجميع القائمة على الأشجار مثل XGBoost أدق حتى، وقد تكون عمليًا الخيار الأفضل لإصلاح مجموعات البيانات البيئية. مع أدوات قوية لسد الفجوات، يستطيع العلماء تتبع التغيرات الطفيفة في ملوحة السواحل بشكل أفضل، وتحديد أحداث التلوث، ودعم قرارات الإدارة دون أن تُعطّلهم أعطال المستشعرات الحتمية. ويمكن تكييف نفس الاستراتيجيات مع العديد من المشكلات الهندسية والبيئية الأخرى حيث تكون تدفقات البيانات غنية وضوضائية وأحيانًا ناقصة.
الاستشهاد: Mahdavi-Meymand, A., Sulisz, W. & Nandan Bora, S. Application of swarm-based deep neural networks and ensemble models for reconstruction of specific conductance data. Sci Rep 16, 7292 (2026). https://doi.org/10.1038/s41598-026-38136-z
الكلمات المفتاحية: جودة مياه السواحل, الموصلية النوعية, تعلم الآلة, إعادة بناء البيانات المفقودة, XGBoost