Clear Sky Science · ru

Глубокие остаточные сети с сверточной обработкой признаков для краткосрочного прогнозирования нагрузки

· Назад к списку

Почему потребление электроэнергии на завтра важно уже сегодня

Каждый раз, когда мы включаем переключатель, энергетические компании должны уже иметь готовое нужное количество электроэнергии. Если выработки слишком мало, мерцают лампы и останавливаются заводы; если слишком много — тратят лишнее топливо и деньги. В этой статье рассматривается новый метод искусственного интеллекта, который помогает операторам сетей прогнозировать покомпонентно, по часам, сколько электроэнергии люди будут потреблять в следующий день в самых разных климатах — от заснеженной Новой Англии до тропической Малайзии.

Figure 1
Figure 1.

Задача угадывания наших ежедневных энергетических потребностей

Краткосрочное прогнозирование нагрузки — это задача предсказания, сколько электроэнергии региону потребуется от следующего часа до следующей недели. Эти прогнозы направляют ключевые решения: какие электростанции запускать, как планировать техобслуживание и энерготорговлю. Даже небольшое улучшение может сэкономить большие суммы; для крупной компании сокращение ошибки прогноза лишь на один процент может сэкономить миллионы долларов в год на топливе. Но спрос на электроэнергию формируется множеством взаимосвязанных факторов: время суток, день недели, сезон, погода, праздники и меняющиеся привычки. Надёжно уловить все эти шаблоны сложно, особенно по мере усложнения энергетических систем и увеличения климатической вариативности.

Ограничения прежних «умных» инструментов

Исследователи давно пытались улучшить эти прогнозы с помощью математических моделей и, в последнее время, глубокого обучения. Традиционные подходы, такие как регрессия и простые нейронные сети, испытывают трудности при росте числа входов: они часто упускают тонкие закономерности или переобучаются на прошлых данных. Более продвинутые сети имеют свои сильные и слабые стороны: сверточные сети хорошо выявляют краткосрочные колебания, но хуже улавливают долгосрочные тренды; рекуррентные сети, такие как LSTM и GRU, способны отслеживать более длинные последовательности, но медленнее и сложнее в обучении; модели Transformer захватывают сложные взаимосвязи, но требуют значительных вычислительных ресурсов и могут становиться нестабильными при большой глубине. Популярный компромисс — глубокая остаточная сеть — добавляет «шорткаты», которые помогают очень глубоким моделям учиться без разрушения процесса обучения. Однако большинство ранних конструкций использовали эти остаточные приёмы только в поздних слоях предсказания, а не на тех критических ранних этапах, когда извлекаются сырые признаки.

Двухэтапная модель, которая смотрит близко и далеко

Авторы предлагают переработанную систему прогнозирования под названием CNN‑Embedded Deep Residual Network. На первом этапе модель фокусируется на локальных деталях. В неё подаются недавняя история нагрузки и температуры — от последних 24 часов до нескольких месяцев — через одномерные сверточные блоки. Эти блоки работают как скользящие окна, просматривающие временные ряды, чтобы обнаружить повторяющиеся формы: утренние пики, вечерние всплески, падения в выходные или внезапные погодные скачки. Шаг пулинга сжимает каждую обнаруженную закономерность в компактное представление, уменьшая шум и сохраняя наиболее важное. Параллельно обрабатывается календарная информация — сезон, день недели, флаги праздников — и затем объединяется. Двадцать четыре небольшие подсети, по одной на каждый час следующего дня, преобразуют эти обогащённые признаки в начальный 24‑часовой прогноз.

Figure 2
Figure 2.

Глубокое уточнение и тесты на двух очень разных сетях

На втором этапе улучшенная остаточная сеть принимает этот начальный прогноз и шлифует его. Стековые «блоки» с шорткат‑связями корректируют почасовые значения, сохраняя при этом реалистичную общую форму дня и предотвращая «застревание» обучения. Команда обучала и настраивала эту архитектуру на двух реальных наборах данных: ISO New England, охватывающем шесть штатов США с выраженной сезонностью, и Малайзии, где потребление электроэнергии более стабильно в тропическом климате. Они сравнили свою модель с широким набором альтернатив, включая чисто сверточные сети, несколько рекуррентных сетей, Transformer, исходную конструкцию остаточной сети и варианты, добавлявшие только сверточную или только остаточную часть по отдельности. Оценку качества проводили стандартными метриками ошибок, в первую очередь средним абсолютным процентным отклонением, и проверяли статистическую значимость с помощью интенсивного бутстрэп‑ресемплинга.

Что показывают результаты о «умных» сетях

CNN‑Embedded Deep Residual Network последовательно давала наиболее точные прогнозы. По данным Новой Англии она снизила среднюю процентную ошибку примерно до 1.53 процента, улучшив результаты сильных остаточных конкурентов примерно до 11 процентов. В Малайзии, где закономерности более гладкие и добиться улучшений сложнее, модель всё равно сократила ошибку примерно до 5.06 процента и опередила все другие модели. Сезонные проверки показали, что метод справлялся с пиками весной и летом, зимними нагрузками на отопление и тропическими сезонами дождей и засух без потери точности. Статистические тесты подтвердили, что эти улучшения не случайны. Для неспециалистов вывод ясен: сочетая «микроскоп» для краткосрочных шаблонов с «основой», которая стабилизирует глубокое обучение, этот подход даёт операторам сетей более надёжный способ предвидеть потребление электроэнергии на завтра, экономя средства, сокращая потери и поддерживая переход к более умным и чистым энергетическим системам.

Цитирование: Liu, J., Ahmad, F.A., Samsudin, K. et al. Deep residual networks with convolutional feature extraction for short-term load forecasting. Sci Rep 16, 6382 (2026). https://doi.org/10.1038/s41598-026-35410-y

Ключевые слова: краткосрочное прогнозирование нагрузки, глубокое обучение, электросеть, сверточные нейронные сети, остаточные сети