Clear Sky Science · ar
التحسين متعدد الأهداف المدفوع بالتعلّم المعزّز العميق وتطبيقاته على استراتيجية تشغيل وصيانة بنية الإضاءة التحتية
إضاءات أكثر ذكاءً لأنفاق أكثر أمانًا
أثناء القيادة عبر نفق طريق سريع طويل، نفترض ضمنيًا أن الأضواء ستظل ساطعة ومستقرة. ومع ذلك، فإن الحفاظ على عمل آلاف التجهيزات بأمان دون إهدار أموال على إصلاحات غير ضرورية يعد عملًا معقدًا. تقدم هذه الورقة طريقة جديدة لإدارة إضاءة الأنفاق تستخدم الذكاء الاصطناعي لموازنة هدفَين متنافسَين باستمرار: الحفاظ على موثوقية الإضاءة للسائقين والتحكم في التكاليف الإجمالية.
لماذا من الصعب إدارة أضواء الأنفاق
إضاءة الأنفاق ضرورية لسلامة المرور. عندما تتقدم المصابيح في العمر أو تفشل الدوائر، قد ينخفض مستوى الإضاءة فجأة، مما يصعّب على السائقين تقدير المسافات والسرعات ويزيد من خطر الحوادث. تعتمد الصيانة التقليدية على جداول ثابتة أو عتبات بسيطة أو قواعد ذات هدف واحد مثل «تقليل التكلفة» أو «تعظيم عمر المصابيح». هذه الأساليب لا تتعامل جيدًا مع الأنفاق الحقيقية، حيث تتغير الظروف بمرور الوقت، وتهرم آلاف التجهيزات بمعدلات مختلفة، وغالبًا ما تتضارب متطلبات السلامة مع متطلبات التكلفة. يجادل المؤلفون بأن المطلوب هو طريقة تستطيع التعلم باستمرار من البيانات وتكييف القرارات مع تغيّر النظام.

تعليم وكيل رقمّي لصيانة الأضواء
يبني الباحثون «وكيلًا» رقميًا يتعلم متى وكيف يصلح أو يستبدل أو يضبط أضواء النفق من خلال التفاعل مع نفق محاكَ. يستند هذا الوكيل إلى التعلّم المعزّز العميق، وهو فرع من الذكاء الاصطناعي يجرب فيه النظام إجراءات، يراقب النتائج، ويتعلم تدريجيًا استراتيجيات تزيد من المكافأة. في هذه الحالة تجمع المكافأة بين تكلفة التشغيل (استهلاك الطاقة، العمالة، قطع الغيار، وعقوبات السلامة) وصحة النظام (احتمال استمرار عمل المصابيح بشكل موثوق). يرى الوكيل صورة مفصّلة للنفق: سطوع كل وحدة ضوئية، ما إذا كانت تفشل، بيئة الإضاءة المحيطة، وعلامات التدهور عبر الزمن. في كل خطوة يختار إجراءات لكل مصباح — عدم التدخل، زيادة السطوع، تخفيض السطوع، الإصلاح، أو الاستبدال — ويحصّل تغذية راجعة حول كيفية تأثير هذه الاختيارات على كل من التكلفة والموثوقية.
نمذجة كيفية تدهور الأضواء
لإعطاء الوكيل عالمًا واقعيًا ليتعلم فيه، يبني المؤلفون أولًا نموذجًا رياضيًا لكيفية تدهور أضواء النفق. يستخدمون نوعًا من عمليات السير العشوائي (عملية فينر) التي تلتقط كلًا من الانحراف الثابت نحو الفشل وعدم اليقين الناجم عن ظروف العالم الحقيقي مثل تقلبات الحرارة. باستخدام بيانات تشغيل لأربع سنوات من أكثر من 2000 وحدة LED في نفق بطول 7 كيلومترات في مقاطعة يونان، يضغطون العديد من قراءات المستشعرات إلى مؤشر «صحة» موحّد ويظهرون أن نموذج التدهور هذا يطابق الواقع عن قرب. يتنبأ بكيفية زيادة احتمال الفشل مع الزمن وكمية العمر المتبقي المرجّح لكل مصباح. يغذّي هذا النموذج البيئة المحاكاة التي يتدرّب فيها الوكيل على استراتيجيات الصيانة دون تعريض السائقين الحقيقيين للمخاطر.
موازنة التكلفة والموثوقية في آن واحد
مساهمة رئيسية في العمل هي اعتباره التكلفة والموثوقية كهدفيْن متساويَي الأهمية بدلًا من دمجهما في رقم واحد. يحول المؤلفون مشكلة تعدد الأهداف إلى العديد من المشكلات الفرعية الأبسط، يمثل كل منها مفاضلة مختلفة بين تكلفة منخفضة وموثوقية عالية. لكل مشكلة فرعية يجد الوكيل المتعلم استراتيجية جيدة؛ مجتمعة تشكّل هذه الاستراتيجيات «حدًا» من أفضل الحلول التوافقية الممكنة. لتسريع العملية، يسمح الفريق للمشكلات الفرعية المتجاورة بمشاركة ما تعلّموه عندما تكون مفاضلاتها متشابهة، بدلًا من تدريب كل منها من الصفر. كما يعيدون تشكيل مقياس الموثوقية بحيث يصبح عملية التعلم أكثر حساسية خاصة عندما يقترب النظام من مستويات فشل خطيرة، دافعين الوكيل للرد بشكل أكثر حزمًا قبل أن تتعرض السلامة للخطر.

ما الذي تحققه الاستراتيجية الجديدة
عند الاختبار مقابل عدة استراتيجيات صيانة نفق شائعة — مثل التفتيش بفواصل زمنية ثابتة، أو الزناد المبني على مستوى السطوع، أو قواعد تستند إلى معدلات الفشل — توفر المنهجية الجديدة توازنًا أفضل بين السلامة والنفقات. تقلّص تكاليف الصيانة والتشغيل الإجمالية بنحو 30 بالمئة مع الحفاظ على موثوقية عالية ومنع الوكيل المتعلم من أن يصبح متحفظًا للغاية أو متهوّرًا. كما يجعل مخطط مشاركة المعاملات التدريب أكثر كفاءة، مخفضًا وقت الحوسبة ومحسّنًا تغطية مفاضلات التكلفة-الموثوقية الممكنة. للقراء غير المتخصصين، الخلاصة هي أن هذه الطريقة تستخدم البيانات والتعلّم التكيفي لتقرير متى وأين يجب التدخّل في النفق بدقة، بحيث تبقى الأضواء آمنة للسائقين بينما يدفع دافعو الضرائب أو المشغّلون أقل على مدار عمر النظام.
الاستشهاد: Wang, Z., Tang, J., Wei, P. et al. Deep reinforcement learning-driven multi-objective optimization and its applications on lighting infrastructure operation and maintenance strategy. Sci Rep 16, 8989 (2026). https://doi.org/10.1038/s41598-026-37811-5
الكلمات المفتاحية: إضاءة الأنفاق, الصيانة التنبؤية, التعلّم المعزّز, موثوقية البنية التحتية, التحسين متعدد الأهداف