Clear Sky Science · zh

基于深度学习混合框架的空气质量预测模型

2026-02-03 · 返回目录

更清晰的空气预报为何与您息息相关

当雾霾笼罩城市时，人们不得不做出现实选择：在户外慢跑是否安全、是否送孩子上学、工厂是否继续生产？这些决策依赖于我们对微小污染颗粒PM2.5的预测能力——它们小到能深入肺部。本研究提出了一种新型计算模型，利用人工智能的最新进展来更准确、更快速地预测中国城市的PM2.5水平，相较于许多现有工具可为公众和决策者提供更早、更可靠的警示。

从烟雾弥漫到数据智能

空气污染已成为许多城市地区持续的健康威胁，尤其是在中国北方，高浓度的PM2.5与呼吸系统和心血管疾病有关。城市现在运行着密集的监测网络，每小时追踪PM2.5、其他污染物和局地气象。传统的预测方法依赖简化的数学或手工构建的物理模型，这些方法在应对风场涡动、温度变化和人类活动等复杂非线性现实时表现受限。相比之下，名为CBLA的新方法通过用来自北京和广州多年的观测数据训练现代神经网络，让数据“自行说话”。

新的预测引擎如何工作

CBLA像一支分层的专家团队，从不同角度审视污染数据后再对最终预测投票。首先，一个称为一维卷积网络的组件扫描多个监测站的测量值，捕捉跨空间重复出现的模式，例如烟雾如何从一个街区扩散到另一个。接着，一个双向记忆网络正向和反向地读取污染历史，学习今日浓度如何受近期和稍早情况的共同影响。然后，注意力机制突出最具影响力的小时和特征，使模型能够更多地关注例如昨天的突增和强风，而不是较远、相关性较低的读数。

加入气象数据以使画面更清晰

污染并非孤立移动；它随天气变化而变化。为将这些信息整合得更干净，作者加入了第二阶段，将初步的神经网络预测和详细的气象数据（如风速、湿度和温度）一并输入到一种称为XGBoost的强大树基算法中。该阶段像一位经验丰富的气象预报员，将初始预测与当前天气交叉核验，适当上调或下调预测值。测试表明，这种组合降低了典型预测误差，并改善了模型输出与实测值的一致性，尤其在突发污染累积和清散事件期间表现明显。

与竞争模型的比对测试

研究人员将CBLA与多种替代方法进行了比较，从回归和ARIMA时间序列模型等经典技术，到结合图网络与Transformer的复杂深度学习混合模型。在三个真实数据集上，CBLA始终产生最低的平均误差和与观测PM2.5水平最紧密的拟合。重要的是，它在准确性上可与一些最先进的现代模型相媲美，但在标准硬件上的训练时间仅约为它们的三分之一。对注意力机制的可视化显示，模型自然对最近几小时的数据以及风速和历史PM2.5等具有物理意义的因子赋予更大权重，这为其决策如何与气象直觉一致提供了窗口。

这对日常生活意味着什么

从实用角度看，研究表明，慎重地结合多种人工智能技术可以得到一种不仅更准确而且更快速、易于解释的污染预报工具。城市管理者可以利用此类模型发布健康建议、调整交通限制或在危险雾霾高峰到来前数小时预先缩减工业生产。对居民而言，更好的预报意味着在何时佩戴口罩、启动空气净化器或让儿童留在室内方面有更明确的指引。尽管这项工作聚焦于中国城市和PM2.5，但相同的框架可适配到其他地区和污染物，指向一个数据驱动的预报将帮助数百万人更轻松呼吸的未来。

引用: Yin, C., Li, W., Li, T. et al. Air quality prediction model based on deep learning hybrid framework. Sci Rep 16, 7084 (2026). https://doi.org/10.1038/s41598-026-37896-y

关键词: 空气质量预测, PM2.5, 深度学习, 城市污染, 气象学