Clear Sky Science · ru

Объяснимая прогнозная аналитика временных рядов с безвыборочным SHAP для трансформеров

2026-05-27 · Назад к списку

Почему умные прогнозы нужно понимать

От планирования энергосети до установления завтрашних цен на электроэнергию — многие решения опираются на компьютерные модели, предсказывающие изменение показателей со временем. Эти модели стали чрезвычайно мощными, но при этом менее прозрачными, что вызывает осторожность при их использовании в критичных областях, таких как энергетика. В этой статье представлен SHAPformer — подход к прогнозированию, который не только делает точные предсказания, но и ясно показывает, какие фрагменты прошлой информации сильнее всего повлияли на каждый прогноз.

Как прогнозирование превращается в «черный ящик»

Современное прогнозирование временных рядов часто использует глубокое обучение, особенно трансформеры, изначально разработанные для языкового перевода. Они способны обрабатывать множество входных данных — прошлый спрос на электроэнергию, погодные данные, календарную информацию — и изучать сложные закономерности в больших наборах данных. Однако их внутренние механизмы в значительной степени скрыты, и пользователи не всегда могут понять, почему дано то или иное предсказание. Эта непрозрачность важна на практике, поскольку операторы сетей, регуляторы и компании всё чаще требуют объяснений перед тем, как полагаться на выводы моделей, которые могут повлиять на затраты, безопасность или соблюдение нормативов.

Способ справедливо распределять вклад между входами

Одна популярная семья инструментов объяснения основана на идее справедливого распределения «кредита» между входами. В этом подходе каждая признак (например, вчерашний спрос или сегодняшняя температура) рассматривается как игрок в кооперативной игре, а предсказание модели — как результат этой игры. Методы, основанные на концепции Шепли и объединённые под именем SHAP, оценивают, сколько в среднем вносит каждый признак, сравнивая предсказания с наличием и без наличия этого признака. Существующие инструменты SHAP для временных рядов обычно полагаются на генерацию множества искусственных примеров или замену отсутствующих входов значениями по умолчанию, что может быть медленно и создавать нереалистичные сценарии, искажающие объяснение.

Новый короткий путь SHAPformer к понятным ответам

SHAPformer перестраивает саму прогнозную модель так, чтобы объяснения возникали естественно, без интенсивного семплирования. Он группирует связанные входы — например, все значения за один день или все наблюдения одной погодной переменной — и обучает трансформер работать даже когда некоторые из этих групп намеренно скрыты. С помощью техники, называемой манипуляцией вниманием (attention manipulation), модель может чётко включать или выключать группы признаков при генерации прогноза. Это позволяет вычислять точные вклады в стиле SHAP, оценивая все комбинации таких групп напрямую, а не аппроксимируя их случайными образцами. В результате модель может объяснить один прогноз менее чем за секунду — ускорение примерно в 50–1000 раз по сравнению с широко используемым методом SHAP, основанным на семплировании.

Figure 1. Как сигналы прошлого спроса, погоды и календаря поступают в интерпретируемую модель для прогнозирования будущего потребления электроэнергии.

Проверка объяснений на известной истине

Чтобы проверить надёжность объяснений SHAPformer, авторы сначала создали синтетический набор данных, где правила генерации данных полностью известны. Затем они использовали эти правила, чтобы вывести «истину на земле» (ground truth) о том, насколько должен быть важен каждый вход и как именно он должен влиять на прогноз. Объяснения SHAPformer тесно совпали с этой эталонной правдой — как по общей важности, так и по детализированным паттернам, например сокращению спроса в праздничные дни или изменению суточных кривых по выходным. Конкурирующие методы либо неверно оценивали, какие признаки наиболее значимы, либо давали более шумные и непоследовательные объяснения.

Что модель показывает о реальных энергетических данных

Далее SHAPformer применили к реальным данным по потреблению электроэнергии от немецкого оператора передачи и к ценам на электроэнергию на сутки вперёд в одном европейском рыночном регионе. В случае нагрузки модель подтвердила, что наиболее влиятельным входом является нагрузка за неделю до прогнозируемого момента, за ней следуют день недели и час, а также температура, месяц и праздники, которые вносят ясные, но меньшие эффекты. Модель уловила интуитивные закономерности: более низкие нагрузки в выходные, снижение активности вокруг Рождества и рост спроса в холодные дни. Для цен на электроэнергию модель выделила влияние прошлых цен и суточных паттернов, а также показала, как сильная генерация ветра и солнечной энергии склоняет цены вниз — в соответствии с экономическими ожиданиями.

Figure 2. Как маскирование групп входов внутри трансформера выявляет влияние каждой группы на почасовые прогнозы энергопотребления.

Почему эти выводы важны

SHAPformer демонстрирует, что можно строить прогнозные модели, которые одновременно эффективны и прозрачны в своём обосновании. Вместо того чтобы рассматривать объяснения как дорогостоящую надстройку, метод закладывает их в архитектуру трансформера, так что каждое предсказание сопровождается быстрым и достоверным разбором факторов, его определивших. Для лиц, принимающих решения в энергетике и других областях, чувствительных ко времени, это означает возможность видеть не только то, что модель ожидает, но и почему — что поддерживает лучшее суждение, регуляторную прозрачность и более обдуманное использование передовых ИИ-инструментов.

Цитирование: Hertel, M., Pütz, S., Mikut, R. et al. Explainable time-series forecasting with sampling-free SHAP for Transformers. Nat Commun 17, 4723 (2026). https://doi.org/10.1038/s41467-026-73243-5

Ключевые слова: прогнозирование временных рядов, объяснимая ИИ, модели трансформеров, электрическая нагрузка, значения SHAP