Clear Sky Science · zh

用于多变量时间序列预测的预训练多尺度 RWKV-GCN

· 返回目录

为何更智能的预测很重要

从预测高峰时段交通到平衡电网,许多现代系统都依赖于对未来的预判。这些系统同时收集来自多种来源的测量流——温度、路面传感器、电表、汇率等等。从这错综复杂的信号网络中做出准确预测并不容易:每条序列都会随时间变化,而且序列之间也相互影响。本文提出了一种新的预测方法,称为 PMSRWKV-GCN,旨在理清这些关系,使计算机能够做出更准确、更稳定的未来预测。

大量信号,众多隐含模式

在实际应用中,预报员很少只处理一条曲线。城市的交通网络、能源系统或全球货币市场都会同时产生大量时间序列。要预测接下来会发生什么,模型必须既理解每个单独信号如何随时间演化,又要理解不同信号如何相互影响。经典统计工具在单条序列上表现良好,但在数十或数百条序列相互交织时会力不从心。较新的深度学习模型,如循环网络和 Transformer,虽有所改善,但常常需要大量计算,而且在面对长时间历史和信号间噪声关系时可能会困惑。

先找出节律再学习关联

作者认为,一个主要难点在于时序:如果模型过早尝试学习序列间的关系,微弱或伪造的关联可能会淹没每条信号中真实的节律。他们的解决方案是将任务拆分为两个阶段。首先,该方法专注于发现每条序列内部清晰的时间模式。它通过应用一种快速的数学工具(快速傅里叶变换,FFT)来揭示主导周期——日周期、周周期或季节性节律。在这些周期的引导下,重新设计的“时间混合”组件同时以多种时间尺度观察每条序列,从短期波动到长期波形。在此预训练阶段,每个通道独立处理,以避免序列间的串扰注入噪声。

Figure 1
图 1。

让网络学习影响图谱

一旦模型为每条序列学会了可靠的时间模式,它就进入第二阶段,在此阶段才引入序列间的关系。在这里,该方法将信号集合视为一个网络:每条序列是一个节点,连接表示两个序列互相影响的强度。模型并不假定固定的连接图,而是使用基于图的神经网络直接从数据中学习这张图。关键是,这一学习在与先前发现的周期相匹配的多重时间尺度上进行。对于每个尺度,网络既细化节点特征,也调整连接模式,然后用源自基础周期强度的权重将它们融合在一起。这样的多尺度图设计使模型能够强调最有信息量的关系,同时弱化那些较弱、不太有用的连接。

在真实世界中测试该方法

研究者在八个公共数据集上评估了 PMSRWKV-GCN,这些数据集反映了实际预测的挑战:来自数百客户的用电需求、加州的公路交通、气象测量、变压器温度以及主要经济体之间的外汇汇率。在从几步以后的短期预测到长期预测的一系列预测跨度中,该新模型通常比若干强基线方法(包括基于 Transformer 和其他基于图的方法)产生更低的误差。消融分析表明两个阶段都很重要:去掉多尺度时间混合会削弱模型对时间结构的把握,而去掉多尺度图在序列间存在强相互作用的数据集上会严重损害性能。对时间模块进行单独预训练还能进一步提高各数据集上的准确性和稳定性,提升幅度为几个百分点。

Figure 2
图 2。

对日常预测的意义

对于非专业读者,关键信息是作者构建了一个将“每个信号倾向于做什么”与“信号如何相互影响”分离开的预测系统,然后以受控的方式重新组合这些见解。通过先为每条序列学习干净的节律,再在之后学习一个灵活的影响网络,PMSRWKV-GCN 避免了被噪声或弱相关数据误导。其结果是一个在能源、交通、气象和金融等领域能够更可靠地跟踪突变和复杂周期的模型。这种分阶段、多尺度的方法为未来更准确、在面对真实世界混乱数据时更稳健的预测工具提供了蓝图。

引用: Hao, J., Liu, F. & Zhang, W. Pre-trained multi-scale RWKV-GCN for multivariate time series forecasting. Sci Rep 16, 10250 (2026). https://doi.org/10.1038/s41598-026-41091-4

关键词: 时间序列预测, 多变量数据, 深度学习, 图神经网络, 时间模式