Clear Sky Science · ar
التحسين التكيفي متعدد الأهداف لإدارة طاقة الميكروجريد باستخدام التعلم المعزز العميق مع الأخذ في الاعتبار تدهور البطارية وعدم يقين الطاقة المتجددة
طاقة محلية أذكى للحياة اليومية
مع ازدياد عدد المنازل والحُرم والمؤسسات التي تركّب ألواح شمسية وبطاريات، يصبح اتخاذ قرار متى تُشترى الكهرباء أو تُخزن أو تُستخدم مهمة دقيقة ذات مخاطر عالية. إذا ما أُديرت جيدًا، تقلل الفواتير والتلوث؛ وإذا أُديرت بشكل سيئ، تُهدر طاقة نظيفة وتتلف بطاريات باهظة الثمن. تستعرض هذه الدراسة كيف يمكن لشكل من أشكال الذكاء الاصطناعي يُدعى التعلم المعزز العميق أن يعمل كـ «مشغّل رقمي» لميكروجريد شمسي-بطاري، متعلّمًا يومًا بعد يوم كيف يُقلل التكلفة، ويزيد استخدام الطاقة المتجددة، ويحمي البطارية من الشيخوخة المبكرة — حتى عندما تكون توقعات الطقس خاطئة.

لماذا تهم الشبكات الكهربائية الصغيرة
الميكروجريدات أنظمة طاقة مدمجة تربط بين الألواح الشمسية وتخزين البطاريات والأجهزة القابلة للضبط والاتصال بالشبكة الأكبر. يمكنها تزويد حرم جامعي أو حي بالطاقة، ويمكنها الحفاظ على الأحمال الحرجة عندما تكون الشبكة الرئيسية تحت ضغط. لكنها صعبة التشغيل: فالإشعاع الشمسي والطلب يتغيران كل دقيقة، وأسعار الكهرباء تتقلب خلال اليوم، وكل دورة شحن–تفريغ تضعف البطارية تدريجيًا. تعتمد أساليب التحكم التقليدية على تحسينات رياضية وتوقعات دقيقة، والتي كثيرًا ما تنهار عندما تنحرف الظروف عن التوقعات أو يصبح النظام معقدًا للغاية.
متحكم يتعلّم من الخبرة
بنى الباحثون توأمًا رقميًا مفصّلًا لميكروجريد بحجم حرم جامعي في غرب السعودية، شمل 300 كيلوواط من الألواح الشمسية، وبطارية ليثيوم-أيون كبيرة، وأحمالًا مرنة وغير مرنة، ورابطًا ثنائي الاتجاه مع الشبكة الرئيسية. بعد ذلك درّبوا وكيلًا للتعلم المعزز العميق — وتحديدًا شبكة Q عميقة متقدمة — لتشغيل هذا النظام الافتراضي على خطوات زمنية مدتها 15 دقيقة على مدار سنوات محاكاة عديدة. راقب الوكيل مستوى شحن البطارية، وتوقعات قصيرة المدى للشمس والطلب، وأسعار الكهرباء، ودرجة الحرارة، واختار إجراءات مثل مدى شحن أو تفريغ البطارية وما إذا كان ينبغي تشغيل الأحمال القابلة للتأجيل. بعد كل خطوة، تلقى مكافأة جمعت ثلاثة أهداف: دفع مبالغ أقل للكهرباء، وإبطاء تآكل البطارية، والاعتماد أقل على طاقة الشبكة المعتمدة على الوقود الأحفوري.
موازنة التكلفة وصحة البطارية والطاقة النظيفة
لعكس المقايضات الواقعية، دمج الفريق نموذج شيخوخة بطارية قائم على الفيزياء مباشرة في إشارة التعلم. عقّبت دالة المكافأة كلاً من التكاليف قصيرة الأجل وفقدان السعة على المدى الطويل، وحرّمت بشدة انتهاكات حدود الأمان مثل الشحن الزائد أو التفريغ المفرط للبطارية. على مدى نحو 10,000 يوم محاكاة من التدريب، اكتشف الوكيل استراتيجيات ينصح بها الناس كثيرًا — لكنه لم يُعلّمها صراحةً. تعلّم تفضيل العديد من دورات الشحن ذات العمق المتوسط بدلًا من عدد قليل من الدورات العميقة، والحفاظ على البطارية في نطاق شحَن متوسط حيث تكون الشيخوخة أبطأ، وترك مساحة كافية في البطارية قبل ساعات الشمس حتى يمكن تخزين طاقة الشمس القادمة بدلًا من هدرها.
تفوق على متحكم ذكي تقليدي
اختبر المتحكم القائم على التعلم مباشرة مقابل معيار قوي معروف باسم التحكم التنبؤي النموذجي، المُستخدم على نطاق واسع في الصناعة والذي يفترض توفر توقعات جيدة. على مدار عام كامل من بيانات الطقس والطلب، خفّضت السياسة المتعلّمة تكاليف التشغيل الإجمالية بنحو 12 بالمئة، وقللت فقدان سعة البطارية بأكثر من 8 بالمئة، وزادت استخدام الطاقة الشمسية المولّدة محليًا بحوالي 10 بالمئة. كما قلّصت استهلاك الطاقة في ذروات السحب من الشبكة وخفّضت الانبعاثات الكربونية المرتبطة بحوالي 14 بالمئة. وربما الأبرز، أن المتحكم المعتمد على الذكاء الاصطناعي اتخذ القرارات بعد التدريب في غضون آلاف من الثانية — أسرع بكثير من أمثاله التقليدي الذي يحتاج إلى ثوانٍ لإجراء التحسين — ما يجعله مناسبًا للأجهزة الرخيصة في الموقع.

الثبات عندما تخطئ التوقعات الجوية
يجب أن تتعامل الميكروجريدات الحقيقية مع مفاجآت غائمة وتوقعات غير كاملة. عرض الباحثون كلا المتحكمين لتوقعات شمسية متزايدة الخطأ. عندما تزايدت أخطاء التنبؤ إلى مستويات شديدة، ارتفعت تكاليف المتحكم التقليدي بأكثر من خُمس، بينما ارتفعت تكاليف المتحكم القائم على التعلم بأقل من عُشر. تعامل الوكيل الذكي أيضًا مع التقلبات السريعة في الإشعاع الشمسي بشكل أكثر سلاسة، مستخدمًا البطارية لتنعيم تدفقات الطاقة دون اللجوء إلى تفريغات عميقة مدمرة. كما جدولة الأحمال المرنة لتتزامن مع إنتاج الشمس وساعات الأسعار المنخفضة، مما خفّف الضغط على الشبكة.
ماذا يعني هذا لأنظمة الطاقة المستقبلية
بعبارات يومية، تُظهر الدراسة أن ذكاءً اصطناعيًا مُدرّبًا قادر على تشغيل نظام شمسي-بطارية كعامل ماهر يهتم بفاتورة اليوم وصحة البطارية غدًا وتأثير كل كيلوواط‑ساعة على المناخ. من خلال التعلم مباشرة من البيانات بدلًا من الاعتماد على توقعات مثالية وصيغ مبسطة، يوفر المتحكم طاقة أرخص وأنظف مع إطالة عمر البطاريات المكلفة. وعلى الرغم من أن العمل أُجري في محاكاة لميكروجريد حرم جامعي في السعودية، يمكن تكييف النهج نفسه لمواقع أخرى وتوسيعه لشبكات من الميكروجريدات، ما يقدّم مسارًا واعدًا نحو أنظمة طاقة محلية أكثر مرونة وكفاءة واستدامة.
الاستشهاد: Altimania, M.R.M., Basem, A., Saydullaev, B. et al. Adaptive multi-objective optimization of microgrid energy management using deep reinforcement learning considering battery degradation and renewable uncertainty. Sci Rep 16, 14296 (2026). https://doi.org/10.1038/s41598-026-44179-z
الكلمات المفتاحية: الميكروجريدات, التعلم المعزز العميق, صحة البطارية, الطاقة المتجددة, إدارة الطاقة