Clear Sky Science · zh
SIGMAformer:一种用于全球天气预报的时空高斯混合相关变换器
为何更智能的天气预报很重要
从热浪到突发风暴,极端天气影响着日常生活、能源使用和全球的安全。现代数值模式已经能详尽地模拟大气,但运行成本高昂且可能错过剧烈的局地变化。本文介绍了一种新的人工智能方法,它直接从成千上万的地面站数据中学习,使得全球的风速和温度预报更准确、更具信息性,尤其在天气剧烈变化时表现突出。
从原始站点数据到全球洞见
传统天气预报依赖基于物理的模型,在固定网格上求解复杂方程。与此同时,来自全球分布不均的观测站会不断上传数以百万计的测量值。这些站点记录捕捉到诸如山地风或城市热岛等局地特征,但难以编织成统一的全局画面。许多近期的机器学习系统要么能处理大尺度的大气模式,要么能反映局地细节,但往往难以同时兼顾两者,并且通常像黑箱一样,很少解释它们为何作出某一预报。
一种发现共享模式的新途径
作者提出了 SIGMAformer,一种为学习数千个地点随时间共同演化的天气而设计的预报架构。其核心是一个模式发现器,它将数据中的相似形态——例如反复出现的风速或温度波动——归为若干代表性模式。模型不再把每个站点和小时当作孤立个体处理,而是学习某一模式何时何地占主导。这些模式随后引导系统的第二部分,后者对最相关的时刻和地点给予更大关注,同时削弱噪声或无用信号。这种有针对性的聚焦使模型能够连接经常共享天气行为的远距区域,例如由喷射流联系的东亚和北美部分地区。
追踪跨时空的天气
为测试 SIGMAformer,作者用来自全球 3850 个站点的两年逐小时风速和温度数据对其进行了训练。他们将其表现与标准统计方法和领先的深度学习模型相比对,使用常见的预报质量度量。在各项评估中,SIGMAformer 在两个变量上都产生了最低的误差,风速的改进尤其明显——风速通常比温度更为不稳定。当研究者移除设计中的关键部分,例如学习站点间变化关联的模块时,性能明显下降,表明这些组件对模型技能至关重要。
观测模型的“思路”
除原始精度之外,研究显示 SIGMAformer 提供了一个观察其如何理解大气的窗口。模型生成的地图和图表展示了在给定预报中它认为最重要的站点和时段。对于温度,它突出显示了既有近邻站点也有通过大尺度气候模式相互联系的远端区域。对于风,它更侧重于短程且移动更快的信号,这与已知的喷射流和行星波行为相吻合。这些可视化模式表明系统并非简单地记忆数据,而是在对齐已被认可的物理过程,这有助于预报员信任并改进其输出。
这对未来天气工具的意义
总体而言,文章得出结论:SIGMAformer 是朝向数据驱动的天气系统迈出的一步,它将细节、尺度与可解释性结合在一起。由于它显式追踪数千个站点之间的关系,所需的计算时间比某些其他神经网络模型更多。然而作为回报,它提供了更准确的预报、更好的极端高温和强风检测能力,以及关于为何做出这些预报的更清晰线索。随着该方法扩展以包含更多气象变量并针对更快的运行进行优化,它有望成为实时预警系统的有用构件,并将来自众多环境传感器的信息汇聚为对变化大气的统一、连贯视图。
引用: Kim, DY., Suk, HI. SIGMAformer: a spatiotemporal Gaussian mixture correlation transformer for global weather forecasting. npj Clim Atmos Sci 9, 113 (2026). https://doi.org/10.1038/s41612-026-01385-w
关键词: 天气预报, 机器学习, 风速预测, 温度预测, 传感器网络