Clear Sky Science · zh
X2-AQFormer:揭示多日逐小时空气污染预测中的动态驱动因素
为何更清晰的空气预报与你息息相关
城市空气污染并非抽象的健康统计数据——它关系到孩子们是否可以安全地在户外玩耍、医院如何为哮喘发作做准备,以及通勤者何时应把车留在家中。欧洲法规即将收紧对氮氧化物和粗颗粒物(PM10)等常见污染物的限值,城市几乎没有犯错的余地。本研究提出了一种新的预测方法,不仅能提前数天预测污染水平,还能解释为何空气会变好或变差,帮助官员和公众做出更聪明、更值得信赖的决策。

更智能地洞察明日空气
研究人员聚焦于斯德哥尔摩的两种关键污染物:氮氧化物(主要与交通有关)和 PM10(来自路尘等来源的较大颗粒)。传统模型基于物理过程模拟污染物在大气中的输送和反应,但它们常表现出系统性误差并依赖于完美的输入数据。现代机器学习系统可以纠正许多此类误差并捕捉复杂模式,然而它们通常像“黑箱”一样,内部推理不透明。作者旨在构建一个既保留先进深度学习准确性的预测系统,又能清楚地揭示哪些因素——例如风、交通相关模式或来袭的天气锋面——在未来数小时和数天内驱动其预测。
一个透明的空气质量“大脑”
研究的核心是 X2-AQFormer,一种基于 Transformer 架构的深度学习模型,Transformer 最初用于处理长序列(如句子)。该模型摄取多源信息:四个监测点的近期污染测量、详细的天气预报,以及一个现有物理驱动的空气质量系统在区域和街巷尺度的模拟输出。X2-AQFormer 不像先按小时递推地只预测下一小时再向前推进,而是直接生成整个 72 小时的逐小时预测,分别针对氮氧化物和 PM10。其特殊的“注意力”机制像一道聚光灯,动态加权各输入对每个未来小时的重要性,这些权重可以读出以展示模型的推理过程。
在人人呼吸的地方提供更好预报
为检验新方法,作者将其与几种强基线进行了比较:斯德哥尔摩运行的确定性操作预报、标准的基于 Transformer 的神经网络,以及广泛使用的基于树的方法如 XGBoost 和随机森林。在四个站点——三条繁忙的街巷和一个城市背景站点——上,X2-AQFormer 持续提供更准确的预测,尤其在最初几小时之后表现更佳。在一到三天的时段内,与确定性模型相比,它将典型误差指标降低了约三分之一,并在与其他深度学习基线比较时最多领先约 11%。值得注意的是,它尤其擅长修正物理模拟中普遍存在的对 PM10 的低估和对氮氧化物的高估,并能以最佳的权衡检测到极高污染事件:既能捕捉危险峰值,又不会触发过多误报。

看见脏与清洁空气背后的隐性驱动
由于 X2-AQFormer 的注意力分数是内建的,团队能够追踪不同影响随时间的升降。对于繁忙街道的氮氧化物,近期测量值与多日确定性预报是主要驱动因素;而在城市背景站点,风、云量和温度变得更为重要,反映出区域性空气运动的作用。对于靠近交通的 PM10,模型依赖过去的颗粒水平和控制路尘再悬浮的天气条件,而在背景站点则在很大程度上“信任”确定性预报。研究者还聚焦于特定降雨事件:尽管降水在平均意义上看似不重要,模型在持续阵雨之前和期间显著提高了对降水的权重,反映出湿润路面抑制扬尘的机制。在 72 小时的预测区间内,系统平滑地将影响从 1 天预报交接到 2 天再到 3 天,展示了其利用来袭信息的直观接力式模式。
将洞见转化为更简洁、更强大的工具
X2-AQFormer 的可解释性并非仅供学术研究;它直接指向简化和改进现实系统的方法。通过按贡献对输入因素排序,作者证明对氮氧化物可以丢弃大约 70% 的特征而仍能匹配或略微提升性能,从而得到一个更轻量、更易维护的模型。PM10 则需要更广泛的输入组合,凸显其更复杂的行为。总体而言,该研究提出了一个实用的“预测—验证—解释—优化”工作流程,城市可以在其中构建准确的预报、严格测试、公开内部逻辑,然后为日常使用简化模型。对于政策制定者和公众而言,这意味着更加精准且更透明、值得信赖的空气质量预报。
引用: Zhang, Z., Schlesinger, D., Johansson, C. et al. X2-AQFormer: unveiling dynamic drivers in multi-day hourly air pollution forecasting. npj Clean Air 2, 17 (2026). https://doi.org/10.1038/s44407-026-00058-5
关键词: 空气污染预测, 城市空气质量, 可解释的人工智能, Transformer 模型, NOx 与 PM10