Clear Sky Science · ru

Адаптивная система обучения с подкреплением для устойчивой оптимизации микросетей в засушливых городских условиях

2026-02-05 · Назад к списку

Как не допустить отключений в пустынном городе

Представьте себе современный город, где летние дни регулярно поднимаются выше 40°C, кондиционеры работают без перерыва, а линии электропередач испытывают сильную нагрузку. Так живут, например, в Эр-Рияде, Саудовская Аравия. В этой статье рассматривается, как новый тип интеллектуальной системы управления, вдохновлённый тем, как компьютеры учатся играть в сложные видеоигры, может координировать работу солнечных панелей, ветряков, батарей, дизель-генераторов и основной сети, чтобы обеспечить питание города дешевле и с меньшим уровнем загрязнения.

Почему важны локальные энергосети

Вместо того чтобы полагаться только на крупные удалённые электростанции, многие города переходят к «микросетям» — небольшим локальным сетям, которые объединяют разные источники энергии и могут обмениваться электричеством с соседями. В жарких и сухих регионах это особенно важно: потребность в охлаждении сильно колеблется с погодой, солнечная энергия приходит скачками в течение дня, а ветер может быть слабым и непредсказуемым. Традиционные системы управления обычно следуют фиксированным правилам или расписаниям и плохо реагируют на внезапные изменения — например, резкий рост использования кондиционеров или пыльный день, закрывающий солнце. В результате чистая энергия тратится впустую, чаще используются дизель-генераторы и растут счета.

Мозг, обучающийся управлять сетью

Исследователи построили детализированную компьютерную модель пяти взаимосвязанных микросетей, представляющих типичные здания и районы Эр-Рияда — большие и маленькие дома, кварталы со смешанным назначением и коммерческие зоны. Каждая микросеть имела собственный набор солнечных панелей, небольших ветряков, дизельного резерва и аккумуляторных хранилищ, а также связь с широкой электросетью. С помощью ПО для моделирования энергопотребления зданий (EnergyPlus) они сгенерировали почасовые данные за год: сколько энергии используется, какая температура, насколько интенсивно светит солнце и дует ветер. Поверх этой модели добавили «агента» обучения с подкреплением — программный мозг, который наблюдает за состоянием системы (потребление, заряд батарей, доступные солнце и ветер, статус генераторов) и принимает решения: заряжать или разряжать батареи, включать или выключать дизель-генераторы, импортировать или экспортировать энергию и делиться электричеством между микросетями.

Как система учится делать более разумный выбор

Обучение с подкреплением действует методом проб и ошибок. В симуляции агент пробует разные управляющие действия почасово и получает вознаграждение или штраф в зависимости от результата. Вознаграждение объединяет три простых цели: минимизировать затраты, обеспечивать электроснабжение и не игнорировать возобновляемую энергию. Если его решения приводят к дорогому использованию дизеля, перебоям с электроснабжением или неиспользуемой солнечной энергии, агент получает штраф. Если он удовлетворяет спрос с помощью большего объёма солнечной и ветровой энергии, снижает выбросы и поддерживает стабильную работу, он награждается. За десятки тысяч раундов обучения агент постепенно находит стратегии, балансирующие эти цели. После обучения он способен принимать решения в реальном времени за доли секунды.

Что происходит, когда пустыня даёт о себе знать

Чтобы проверить, поможет ли этот подход в суровом климате, команда протестировала его в реалистичных и стрессовых условиях. Модель воспроизвела сезонные колебания Эр-Рияда: сильное охлаждение летом и более мягкие нагрузки зимой. Контроллер на базе обучения с подкреплением точно отслеживал как почасовое, так и годовое потребление энергии (объясняя примерно 90–94% вариаций), что важно для прогнозирования пиков. Он уменьшал потери энергии в течение типичного дня и смещал большую часть поставок в сторону солнца и ветра, используя батареи для сглаживания разрывов. Когда исследователи смоделировали события вроде пылевой бури, внезапно уменьшившей солнечную выработку, или тепловой волны, резко увеличившей спрос, система отвечала разрядкой батарей, координацией использования дизеля и обменом избытков энергии между микросетями — всё это без отключения пользователей.

Чище воздух и ниже счета

Помимо стабилизации электроснабжения, исследование оценивало экологические последствия эксплуатационной фазы с помощью жизненного цикла. По сравнению с традиционной системой с правил-ориентированным управлением адаптивная система сократила выбросы CO2 примерно на 14%, снизила образование кислотообразующих выбросов приблизительно на 14% и уменьшила общее потребление энергии примерно на 10%. Эти улучшения в основном объясняются более редким использованием дизель-генераторов и лучшим использованием местной возобновляемой энергии и накопителей. Проще говоря, наделив микросеть «обучающимся мозгом», удалось извлечь больше полезной работы из каждого блока чистой энергии, меньше полагаться на топливо и сохранять надёжность даже в условиях капризов пустынного климата.

Цитирование: Mohamed, M.A.S., Almazam, K., Alzahrani, M. et al. Adaptive reinforcement learning framework for sustainable microgrid optimization in arid urban environments. Sci Rep 16, 7356 (2026). https://doi.org/10.1038/s41598-026-37752-z

Ключевые слова: микросети, обучение с подкреплением, возобновляемая энергия, энергоменеджмент, засушливые города