Clear Sky Science · zh

一种基于强化学习的新方法用于能源市场的短期负荷和价格预测

2026-01-30 · 返回目录

为什么预测明天的用电很重要

每次你打开或关闭电灯开关，背后都有一个庞大的发电厂、市场和计算机网络在运转，确保电力既可用又经济。如果电网运营者能够准确预测未来几小时的用电量和价格走势，就能避免停电、减少浪费并为所有人节省开支。本文探讨了一种新的短期预测方法，该方法借用了最初用于学习玩游戏和控制机器人的技术。

在变化的能源世界里更聪明的预测

电力需求和价格可能在小时之间剧烈波动。热浪、寒潮、节假日和燃料成本都会把系统往不同方向推。传统的预测工具，例如简单的趋势线或常见的机器学习模型，通常把问题当作对过去数据的一次性拟合。当条件快速变化或多种因素以复杂方式相互作用时，它们就会捉襟见肘。作者认为，尤其是那些可再生能源比例日益增长的现代电网，需要能够实时适应并从成功与失败中直接学习的预测工具。

电力市场中的学习代理

研究人员将预测重塑为一个决策游戏。每小时，计算机“代理”观察当前状况：最近的用电需求、过去的价格、温度、湿度、星期几、节假日以及燃料成本等。然后它选择一个动作：对下一小时电力需求和价格的最佳猜测。实际数值到达后，根据预测偏差的大小给代理一个分数——大的误差受到惩罚，小的误差得到奖励。随着时间推移，系统寻求一种能最大化其长期得分的策略，而不仅仅是提高单步的准确性。为处理众多输入，作者采用了基于深度Q网络（Deep Q‑Network，DQN）的深度强化学习架构，这是一种估计在每种情境下各个可能动作好坏的神经网络。

从原始数据到可靠预测

为检验他们的方法，团队使用了来自PJM互联（PJM Interconnection）的真实数据——这是覆盖美国中西部和东海岸部分地区的主要电力市场。他们使用了大约三年的逐小时记录（2021–2023），包括市场价格、电力需求、气象观测和燃料价格指数。在训练前，他们对数据进行了清洗，填补了少量缺失值，剔除了异常离群点，并将所有数据缩放到可比范围内。还使用统计技术在保留大部分有用变异的同时压缩大量输入特征。学习代理随后在这段历史数据上反复训练，逐步从随机试错过渡到利用已发现的模式。

学习代理的表现如何

当与广泛使用的预测方法（包括ARIMA（一种传统的时间序列模型）、LSTM神经网络和流行的XGBoost算法）对比时，强化学习系统表现更佳。在从未见过的保留测试数据上，与这些基线方法相比，它将需求和价格的平均百分比误差大约削减了15–20%。该模型的预测较好地跟踪了冬季和夏季的日循环，并反映了一般的价格波动，尽管对于最剧烈、罕见的价格尖峰和不寻常的节假日行为，模型仍有困难。对学到策略的分析显示，代理隐含地发现了一种经济上合理的模式：在观察到非常高的价格后，它倾向于预期下一小时的需求略有下降，这类似于现实世界中的需求响应，尽管代理并未被明确告知这一行为。

这对日常用电意味着什么

对非专业读者来说，关键信息是这种基于学习的方法可以帮助电网运营者更平稳、更经济地运行电力系统。更准确的短期预测使发电厂和市场运营者能够更高效地安排机组、以更少的意外整合可再生能源，并降低突发价格飙升或短缺的风险。尽管该方法对数据需求大、计算密集，并且在极端事件方面仍需改进，但它指向了一个未来：电力市场将由自适应的、自我改进的工具引导，这些工具不断从消费者行为、天气和燃料成本的不断变化中学习。

引用: Wu, Y., Ma, Y. & Aliev, H. A novel reinforcement learning-based approach for short-term load and price forecasting in energy markets. Sci Rep 16, 5141 (2026). https://doi.org/10.1038/s41598-026-37366-5

关键词: 智能电网预测, 电价预测, 强化学习, 能源需求预测, 深度Q网络