Clear Sky Science · zh
一种基于强化学习的新方法用于能源市场的短期负荷和价格预测
为什么预测明天的用电很重要
每次你打开或关闭电灯开关,背后都有一个庞大的发电厂、市场和计算机网络在运转,确保电力既可用又经济。如果电网运营者能够准确预测未来几小时的用电量和价格走势,就能避免停电、减少浪费并为所有人节省开支。本文探讨了一种新的短期预测方法,该方法借用了最初用于学习玩游戏和控制机器人的技术。
在变化的能源世界里更聪明的预测
电力需求和价格可能在小时之间剧烈波动。热浪、寒潮、节假日和燃料成本都会把系统往不同方向推。传统的预测工具,例如简单的趋势线或常见的机器学习模型,通常把问题当作对过去数据的一次性拟合。当条件快速变化或多种因素以复杂方式相互作用时,它们就会捉襟见肘。作者认为,尤其是那些可再生能源比例日益增长的现代电网,需要能够实时适应并从成功与失败中直接学习的预测工具。

电力市场中的学习代理
研究人员将预测重塑为一个决策游戏。每小时,计算机“代理”观察当前状况:最近的用电需求、过去的价格、温度、湿度、星期几、节假日以及燃料成本等。然后它选择一个动作:对下一小时电力需求和价格的最佳猜测。实际数值到达后,根据预测偏差的大小给代理一个分数——大的误差受到惩罚,小的误差得到奖励。随着时间推移,系统寻求一种能最大化其长期得分的策略,而不仅仅是提高单步的准确性。为处理众多输入,作者采用了基于深度Q网络(Deep Q‑Network,DQN)的深度强化学习架构,这是一种估计在每种情境下各个可能动作好坏的神经网络。
从原始数据到可靠预测
为检验他们的方法,团队使用了来自PJM互联(PJM Interconnection)的真实数据——这是覆盖美国中西部和东海岸部分地区的主要电力市场。他们使用了大约三年的逐小时记录(2021–2023),包括市场价格、电力需求、气象观测和燃料价格指数。在训练前,他们对数据进行了清洗,填补了少量缺失值,剔除了异常离群点,并将所有数据缩放到可比范围内。还使用统计技术在保留大部分有用变异的同时压缩大量输入特征。学习代理随后在这段历史数据上反复训练,逐步从随机试错过渡到利用已发现的模式。
学习代理的表现如何
当与广泛使用的预测方法(包括ARIMA(一种传统的时间序列模型)、LSTM神经网络和流行的XGBoost算法)对比时,强化学习系统表现更佳。在从未见过的保留测试数据上,与这些基线方法相比,它将需求和价格的平均百分比误差大约削减了15–20%。该模型的预测较好地跟踪了冬季和夏季的日循环,并反映了一般的价格波动,尽管对于最剧烈、罕见的价格尖峰和不寻常的节假日行为,模型仍有困难。对学到策略的分析显示,代理隐含地发现了一种经济上合理的模式:在观察到非常高的价格后,它倾向于预期下一小时的需求略有下降,这类似于现实世界中的需求响应,尽管代理并未被明确告知这一行为。

这对日常用电意味着什么
对非专业读者来说,关键信息是这种基于学习的方法可以帮助电网运营者更平稳、更经济地运行电力系统。更准确的短期预测使发电厂和市场运营者能够更高效地安排机组、以更少的意外整合可再生能源,并降低突发价格飙升或短缺的风险。尽管该方法对数据需求大、计算密集,并且在极端事件方面仍需改进,但它指向了一个未来:电力市场将由自适应的、自我改进的工具引导,这些工具不断从消费者行为、天气和燃料成本的不断变化中学习。
引用: Wu, Y., Ma, Y. & Aliev, H. A novel reinforcement learning-based approach for short-term load and price forecasting in energy markets. Sci Rep 16, 5141 (2026). https://doi.org/10.1038/s41598-026-37366-5
关键词: 智能电网预测, 电价预测, 强化学习, 能源需求预测, 深度Q网络