Clear Sky Science · ru

Повышение точности прогнозов ветровой и солнечной энергии с помощью инженерии признаков временных рядов и ансамблевого машинного обучения

· Назад к списку

Почему важны более точные прогнозы для чистой энергии

По мере того как ветряные турбины и солнечные панели обеспечивают большую часть нашей электроэнергии, их природные колебания усложняют поддержание надёжного энергоснабжения. Операторам сетей необходимо знать не только сколько электроэнергии вырабатывается сейчас, но и как эта выработка, вероятно, изменится в ближайшие часы. В этом исследовании рассматривается, как продвинутый анализ данных и машинное обучение могут превратить годы записей о ветре и солнечном излучении в более чёткие краткосрочные прогнозы, которые помогают балансировать предложение и спрос, сокращать потери и поддерживать более надёжную низкоуглеродную сеть.

От сырых показаний мощности к более информативным сигналам

Исследователи работали почти шесть лет с почасовыми данными о ветровой и солнечной генерации по всей Франции, охватывающими более пятидесяти тысяч временных точек. Вместо того чтобы подавать эти сырые числа прямо в модель, они преобразовали их в более богатые сигналы. Добавили информацию о том, какой была выработка час, день или более раннее время назад, вычислили краткосрочные средние и меру изменчивости, а также закодировали календарные закономерности — время суток, день недели и сезон — с помощью круговых функций, отражающих суточные и годовые циклы. Они также тщательно проверили избыточность признаков и возможные «утечки» будущих данных, чтобы модели оценивались на реалистичных задачах прогнозирования, а не на случайном просмотре ответов заранее.

Figure 1. Преобразование прошлых шаблонов ветра и солнечного света в более точные краткосрочные прогнозы для стабильной сети чистой энергии.
Figure 1. Преобразование прошлых шаблонов ветра и солнечного света в более точные краткосрочные прогнозы для стабильной сети чистой энергии.

Обучение машин следовать ритму погоды

Имея на руках эти сконструированные временные ряды, команда протестировала широкий спектр методов прогнозирования. Классические статистические модели, такие как ARIMA, предполагающие относительно простые линейные закономерности, сравнивались с более гибкими системами машинного обучения, включая градиентный бустинг на решающих деревьях и глубокие нейронные сети. Два ансамбля на деревьях, CatBoost и LightGBM, выделились особенно. Эти методы строят множество небольших решающих деревьев, каждое из которых захватывает разные аспекты данных, а затем комбинируют их в единый сильный предиктор. Используя строгую схему скользящей оценки вперёд, где каждый новый прогноз делается только на основе прошлых данных, авторы убедились, что показатели качества будут напоминать те, что можно ожидать в реальной работе сетей.

На какое расстояние вперед мы действительно видим

В исследовании рассматривались прогнозы от одного часа до полного дня вперёд отдельно для ветра и солнца. Для ветра лучшие модели отразили большую часть изменчивости на горизонте в один час, с постепенным снижением качества по мере увеличения времени прогноза. До примерно шести часов вперёд прогнозы всё ещё несли полезную информацию, но к двенадцати–двадцати четырём часам растущее влияние меняющейся погоды делало предсказания намного менее определёнными. Солнечную энергию предсказать на большие горизонты оказалось ещё труднее, потому что облачность и другие быстро меняющиеся факторы могут изменяться так быстро, что это не видно только по прошлой выработке. Модели справлялись неплохо на следующий час, особенно в ясную погоду, но за несколько часов их точность резко падала.

На что модели действительно обращают внимание

Путём систематического удаления групп входных признаков авторы выяснили, какие данные имеют наибольшее значение. Недавние уровни выработки — лаговые значения — оказались единственным доминирующим компонентом, подтверждая, что то, что только что произошло, обычно лучший ключ к тому, что будет дальше. Скользящие средние и меры краткосрочной изменчивости также играли важную роль, особенно когда система переходила из спокойного состояния в ветреное или из облачного в солнечное. Календарные и циклические признаки, такие как час суток, закодированный на круге, становились более важными на больших горизонтах, где широкие суточные и сезонные паттерны значимы больше, чем посекундные колебания. Глубокие модели на основе рекуррентных нейронных сетей могли отслеживать сложные колебания производства, но лучше настроенные ансамбли деревьев достигали сопоставимой или большей точности при меньших вычислительных затратах.

Figure 2. Пошаговый процесс, в котором недавние данные о генерации возобновляемой энергии преобразуются в прогнозы на несколько часов вперёд с использованием многослойных моделей.
Figure 2. Пошаговый процесс, в котором недавние данные о генерации возобновляемой энергии преобразуются в прогнозы на несколько часов вперёд с использованием многослойных моделей.

Что это означает для будущей энергосети

Для широкого читателя ключевое послание в том, что тщательная подготовка временных данных и продуманное тестирование моделей могут реально улучшить способность предсказывать выработку ветровых и солнечных ферм. Сложные, но практичные методы машинного обучения могут обеспечить надёжные прогнозы на ближайшие несколько часов — то окно времени, которое наиболее важно для ежедневного балансирования сети. В то же время исследование показывает, что прогнозирование на полный день вперёд остаётся сложной задачей при опоре только на прошлую выработку, особенно для солнечной энергии. Чтобы продвинуть прогнозирование дальше, будущие подходы должны будут сочетать эти методы, основанные на данных, с подробной информацией о погоде и физическими моделями турбин и панелей, помогая сетям оставаться стабильными по мере того, как доля чистой энергии в нагрузке увеличивается.

Цитирование: Elmunim, N.A., Khlifi, M.A., Aldawsari, M.A. et al. Enhancing wind and solar energy forecasting through time-series feature engineering and ensemble machine learning. Sci Rep 16, 15546 (2026). https://doi.org/10.1038/s41598-026-49373-7

Ключевые слова: прогнозирование возобновляемой энергии, прогноз ветровой энергии, прогноз солнечной энергии, машинное обучение, признаки временных рядов