Clear Sky Science · ru

Адаптивная многокритериальная оптимизация управления энергией микросети с использованием глубокого подкрепления с учётом деградации батареи и неопределённости возобновляемых источников

· Назад к списку

Умнее локальная энергия для повседневной жизни

По мере того как всё больше домов, кампусов и предприятий устанавливают солнечные панели и аккумуляторы, управление моментами покупки, накопления или использования электроэнергии превращается в рискованное жонглирование. Если делать это хорошо — снижаются счета и выбросы; если плохо — чистая энергия тратится впустую, а дорогие батареи преждевременно изнашиваются. В этом исследовании изучается, как форма искусственного интеллекта — глубокое обучение с подкреплением — может выступать в роли «цифрового оператора» для микросети с солнечными панелями и батареей, обучаясь день за днём удерживать низкие затраты, увеличивать долю возобновляемой энергии и защищать батарею от преждевременного старения — даже при неверном прогнозе погоды.

Figure 1
Figure 1.

Почему важны небольшие энергетические сети

Микросети — это компактные энергетические системы, объединяющие солнечные панели, накопители энергии, управляемые приборы и подключение к общей сети. Они могут обеспечивать энергией кампус или район и поддерживать критические нагрузки, когда основная сеть испытывает перегрузки. Но ими трудно управлять: солнечное излучение и спрос меняются по минутам, цены на электроэнергию варьируются в течение дня, а каждый цикл заряда–разряда постепенно деградирует батарею. Традиционные схемы управления опираются на математическую оптимизацию и точные прогнозы, которые часто даёт сбой при отклонениях условий от ожидаемых или при усложнении системы.

Контроллер, обучающийся на опыте

Исследователи создали подробную цифровую копию микросети масштаба кампуса на западе Саудовской Аравии, включающую 300 кВт солнечных панелей, крупную литий‑ионную батарею, гибкие и негибкие нагрузки и двунаправленное подключение к основной сети. Затем они обучили агента глубокого обучения с подкреплением — конкретно продвинутую Deep Q‑Network — управлять этой виртуальной системой с шагом 15 минут на протяжении многих смоделированных лет. Агент наблюдал уровень заряда батареи, краткосрочные прогнозы по солнцу и спросу, цены на электроэнергию и температуру, и выбирал действия, такие как интенсивность зарядки или разрядки батареи и запуск сдвигаемых нагрузок. После каждого шага он получал вознаграждение, которое объединяло три цели: уменьшить расходы на электроэнергию, замедлить износ батареи и меньше зависеть от энергетики на ископаемом топливе.

Баланс затрат, здоровья батареи и чистой энергии

Чтобы учесть реальные компромиссы, команда встроила физически обоснованную модель старения батареи прямо в сигнал обучения. Функция вознаграждения штрафовала как краткосрочные затраты, так и долгосрочную потерю ёмкости, а также строго препятствовала нарушению безопасных пределов, таких как перезаряд или чрезмерный разряд батареи. Примерно за 10 000 смоделированных дней практики агент обнаружил стратегии, которые часто рекомендуют люди — хотя его этому напрямую не учили. Он научился отдавать предпочтение множеству циклов умеренной глубины вместо нескольких глубоких, держать батарею в среднем диапазоне заряда, где старение происходит медленнее, и оставлять достаточно свободного места перед солнечными часами, чтобы будущая энергия могла быть сохранена, а не потеряна.

Превосходство над обычным «умным» контроллером

Новый контроллер на основе обучения протестировали в сравнении с сильной эталонной стратегией, известной как модельно‑предиктивное управление, которое широко используется в промышленности и предполагает наличие хороших прогнозов. По данным за год погоды и спроса изученная политика снизила общие эксплуатационные расходы примерно на 12 процентов, уменьшила потерю ёмкости батареи чуть более чем на 8 процентов и увеличила использование локальной солнечной генерации примерно на 10 процентов. Она также снизила пик нагрузки из сети и сократила связанные с этим выбросы углерода почти на 14 процентов. Возможно, самое примечательное: после обучения ИИ‑контроллер принимал решения за доли секунды — на порядок быстрее секундной оптимизации, требуемой традиционным методом — что делает его подходящим для дешёвого аппаратного обеспечения на месте.

Figure 2
Figure 2.

Устойчивость при неверном прогнозе погоды

Реальные микросети должны справляться с облачными неожиданностями и несовершенными прогнозами. Исследователи подвергли оба контроллера действию всё более неточных предсказаний по солнцу. По мере роста ошибок прогноза до серьёзных уровней затраты традиционного контроллера возросли более чем на пятую часть, тогда как затраты контроллера на основе обучения выросли менее чем на одну десятую. Агент ИИ также более гибко справлялся с быстрыми колебаниями освещённости, используя батарею для сглаживания потоков мощности без перехода к вредным глубоким разрядам. Он планировал гибкие нагрузки в моменты солнечной генерации и низких тарифов, дополнительно снижая нагрузку на сеть.

Что это значит для будущих энергетических систем

В обыденном понимании исследование показывает, что обученный ИИ может управлять системой из солнца и батареи как опытный оператор, который заботится о сегодняшнем счёте, завтрашнем здоровье батареи и климатическом воздействии каждого киловатт‑часа. Обучаясь напрямую на данных, а не полагаясь на идеальные прогнозы и упрощённые формулы, контроллер обеспечивает более дешёвую и чистую энергию и продлевает срок службы дорогих батарей. Хотя работа выполнена в моделировании для кампусной микросети в Саудовской Аравии, тот же подход можно адаптировать к другим местам и расширить до сетей микросетей, что предлагает перспективный путь к более устойчивым, эффективным и экологичным локальным энергетическим системам.

Цитирование: Altimania, M.R.M., Basem, A., Saydullaev, B. et al. Adaptive multi-objective optimization of microgrid energy management using deep reinforcement learning considering battery degradation and renewable uncertainty. Sci Rep 16, 14296 (2026). https://doi.org/10.1038/s41598-026-44179-z

Ключевые слова: микрорети, глубокое обучение с подкреплением, состояние батареи, возобновляемая энергия, управление энергией