Clear Sky Science · zh
基于无采样 SHAP 的可解释时间序列预测(用于 Transformer)
为什么智能预测需要被理解
从电网规划到确定明日电价,许多决策都依赖于预测数值随时间变化的计算模型。这些模型变得非常强大,但内部也更难理解,这会使人在能源等关键领域对其信任产生顾虑。本文提出了 SHAPformer,这是一种不仅能给出准确预测,而且能清晰展示哪些历史信息对每次预测影响最重的预测方法。
预测如何变成“黑箱”
现代时间序列预测常用深度学习,尤其是最初用于语言翻译的 Transformer 模型。它们可以处理许多输入,例如历史用电、天气和日历信息,并从海量数据中学习复杂模式。然而其内部机制大多被隐藏,用户难以直观看到某一预测为何会被做出。这种透明度的缺失在实践中很重要,因为电网运营者、监管机构和企业在依赖可能影响成本、安全或合规性的模型输出前,越来越多地要求解释。
在输入间公平分配“功劳”的方法
一种流行的解释工具族基于在输入间公平分配功劳的思想。在此视角下,每个特征(例如昨天的负荷或今日温度)都被视为合作博弈中的一位参与者,模型的预测是该博弈的结果。基于 Shapley 的方法,统称为 SHAP,通过比较有无某特征时的预测来估计该特征的平均贡献。然而,现有面向时间序列的 SHAP 工具通常依赖于对许多人工样本的采样,或用基线值替换缺失输入,这两种做法既可能很慢,也可能制造不现实的情形,从而扭曲解释。
SHAPformer 通往清晰答案的新捷径
SHAPformer 重新设计了预测模型本身,使解释自然生成,而无需大量采样。它将相关输入分组,例如一天内的所有值或某一天气变量的全部观测值,并训练 Transformer 在某些组被刻意隐藏时仍能工作。通过一种称为注意力操控的技术,模型可以在生成预测时干净地开启或关闭某些特征组。这使得可以通过直接评估这些组的所有组合来计算精确的 SHAP 风格贡献,而非从随机样本中近似得到。结果是,该模型可在不到一秒钟内解释一次预测,相较于一种广泛使用的基于采样的 SHAP 方法,速度提升约 50 到 1000 倍。

通过已知真相检验解释
为了检验 SHAPformer 的解释是否可信,作者首先构建了一个合成数据集,其中生成数据的规则是完全已知的。然后他们利用这些规则推导出每个输入应有多少重要性以及应如何具体影响预测的“真值”。SHAPformer 的解释在整体重要性和细节模式上都与该真值高度吻合,例如假期如何降低负荷或周末如何改变日曲线。竞争方法要么误判了哪些特征最重要,要么给出了更嘈杂且不一致的解释。
模型在真实能源数据上揭示的内容
随后,SHAPformer 被应用于来自一位德国输电系统运营商的实际电力负荷数据,以及一个欧洲市场区域的日度日前电价。在负荷案例中,模型确认了单一最有影响力的输入是前一周同一时刻的负荷,其次是星期几和小时,温度、月份和节假日也有明显但较小的作用。模型捕捉到了直观模式,例如周末负荷较低、圣诞期间活动减少以及寒冷天需求上升。对于电价,模型突出了历史价格和时段模式,同时也显示更强的风电和光伏发电倾向于压低价格,这与经济预期一致。

这些洞见为何重要
SHAPformer 展示了可以构建既有强大性能又可解释的预测模型。与其把解释视为昂贵的附加项,该方法将解释嵌入到 Transformer 的设计中,使每次预测都附带快速且可靠的因素分解。对于能源及其他对时间敏感的行业决策者而言,这意味着他们不仅可以看到模型预计会发生什么,还可以了解原因,从而支持更好的判断、增强监管透明度并更明智地使用先进的 AI 工具。
引用: Hertel, M., Pütz, S., Mikut, R. et al. Explainable time-series forecasting with sampling-free SHAP for Transformers. Nat Commun 17, 4723 (2026). https://doi.org/10.1038/s41467-026-73243-5
关键词: 时间序列预测, 可解释人工智能, Transformer 模型, 电力负荷, SHAP 值