Clear Sky Science · zh
使用深度残差网络进行短期负荷预测的基于梯度的优化算法比较评估
为什么明天的用电量今天就很重要
每当我们开灯或给设备充电,电力公司就必须事先确保有足够的电力供应以满足需求。提前数小时或一天预测明天的需求有助于电网运行者保持供电、避免停电并节约成本。本文探讨了现代人工智能工具如何使这些短期需求预测更准确、更稳定,并指出常被忽视的训练方法选择可能与模型本身一样重要。
跟上不断变化的电网
用电需求随一天中时间、季节、节假日和天气而起伏。传统统计方法在应对这些复杂模式时常显吃力,尤其是当涉及许多不同信号时。深度学习模型通过堆叠多层简单计算而流行,因为它们能学习微妙的非线性关系。其中一种称为深度残差网络的设计在层之间增加了“捷径”连接,使非常深的模型更易训练并更善于捕捉诸如电力负荷等数据中的长期依赖性。

两种考虑天气的“头脑”
作者关注两种密切相关的深度残差模型用于短期负荷预测。第一种使用历史用电量、时间信息(如小时和星期几)以及温度来预测未来24小时的需求。第二种模型增加了来自热带城市的更多气象变量,包括降雨和风速,但用一种标准统计工具将它们压缩为少量组合信号,该工具在减少冗余的同时保留了大部分变异。这使得更丰富的天气信息能为网络提供信息,而不会使模型变得笨重或更难训练。
训练选择如何塑造学习
大多数使用这些深度残差网络进行电力预测的研究通常静默地选择一种流行的训练方法(称为 Adam)并沿用它。这里所说的训练方法指的是在学习过程中逐步调整模型内部参数的数学配方。本文通过系统比较十三种不同的基于梯度的训练算法(包括经典方法和若干现代自适应变体),在相同的模型结构下对这一惯例提出质疑。作者在两个真实世界的数据集上测试它们:一个来自美国新英格兰的温带电力系统,另一个来自马来西亚的热带地区。

不同气候下的最佳方法
在两个地区中,那些根据近期误差模式自适应调整学习步长的方法总体上优于较老的简单方法。对于主要依赖温度作为气象信号的原始模型,一种名为 AMSGrad 的变体在两地都给出了最低的平均预测误差和最稳定的训练表现。当作者改用经过压缩的多气象输入版本时,优势发生了变化。在这种新输入设计下,另一种自适应方法 AdaBelief 略胜一筹,Adam 也表现良好。换言之,改变天气信息的封装方式微妙地重塑了学习景观,从而偏向不同的训练规则。
验证提升是真实而非偶然
为确保观察到的改进不是统计噪声,作者使用了一种重抽样技术,反复在略有不同的数据样本上重演预测任务。这使他们能够估计一种训练方法真正优于另一种方法的可能性。测试表明若干观察到的改进(例如 AMSGrad 在新英格兰数据上优于 Adam,以及在马来西亚某些优化器下压缩气象方法的益处)不太可能仅由偶然造成。
对未来电网的意义
对非专业读者来说,主要结论是:提高用电需求预测的准确性不仅仅是发明新的神经网络或向其中加入更多天气数据。网络的训练方式以及天气输入的数据化方式可以显著改变预测的准确性和稳定性。通过展示某些自适应训练规则能持续改善性能,并且最佳选择可能取决于输入数据的表示方式,本研究为电网规划者和人工智能从业者提供了更清晰的方案,帮助构建更可靠的预测工具,从而让电力系统更安全、更经济。
引用: Liu, J., Ahmad, F.A., Samsudin, K. et al. A comparative evaluation of gradient-based optimization algorithms for short-term load forecasting using deep residual networks. Sci Rep 16, 14949 (2026). https://doi.org/10.1038/s41598-026-45829-y
关键词: 短期负荷预测, 深度残差网络, 优化算法, 电力系统预测, 气象特征