Clear Sky Science · zh

使用混合 CEEMDAN-CNN-IGWO-BiGRU-注意力模型的空气质量指数预测

· 返回目录

更清晰空气预报的重要性

城市居民经常会听到“明天空气良好”或“不健康”等提示,但这些预警往往含糊或滞后。本研究解决一个简单而实用的问题:我们能否更准确地预测日常空气质量,以便公众、医生和城市管理者提前应对?作者以中国南方大城市广州为例,构建了一种新型计算模型,将杂乱的污染记录转变为可靠的次日空气质量指数(AQI)预报,旨在支持现实世界的预警系统。

Figure 1. 用一套分层智能模型,将嘈杂的城市污染记录转化为清晰的次日空气质量预报。
Figure 1. 用一套分层智能模型,将嘈杂的城市污染记录转化为清晰的次日空气质量预报。

解读城市空气的杂乱信号

空气质量受交通、工厂、气象、季节以及沙尘暴等突发事件等多种变化因素影响。因此,AQI 读数以复杂、嘈杂的方式波动,这使许多传统预测工具失效。基于物理的空气模型需要大量计算资源和详尽的排放清单,而简单的统计方法难以应对城市雾霾的起伏。即便许多现代机器学习系统,也很难从如此缠结的数据中辨识出关键模式,且经常需要繁琐的试错来调整内部参数。

把问题拆成更干净的部分

研究者的第一个策略是将每日 AQI 序列拆分为若干更平滑的层,每层捕捉不同时间尺度的变化。他们使用一种信号处理方法,通过向信号中加入少量人工噪声来分离快速波动、中期周期和缓慢的背景趋势,从而避免混叠。高频层包含快速脉冲和随机波动,中间层承载大部分有意义的日常和多日摆动,最后一层描绘长期趋势。将一条杂乱曲线变成几条更规整的子序列,使整体预测任务变得更容易且更具针对性。

教模型“读懂”时间

将这些层分别输入到专门的神经网络中,每个网络结合了两种优势。一组一维卷积模块用不同长度的滤波器扫描短期局部模式,如重复的日周期;其输出再送入一个双向递归网络,沿时间轴前后两向观察,捕捉污染在数日内的积累与消散。随后,注意力模块突出了每个窗口中最有信息量的日子,使模型在形成预测时能够聚焦于最重要的部分。最终,各层的预测被加和回归以恢复总体预期的 AQI。

让数字“狼群”调节参数

现代神经网络有许多设计选择,例如滤波器或单元的数量、学习速率以及随机失活比例。手动选择这些参数既缓慢又常常不是最优。为避免这一点,作者采用了受灰狼捕猎行为启发的群体搜索方法。虚拟的“狼”在可能的参数空间中游走,依据每个候选网络在验证集上的预测表现进行引导。改进的探索与精化策略帮助群体逃离局部最优,锁定那些能保持低预测误差和稳定学习的参数组合。

Figure 2. 分步流程:将空气数据按时间尺度拆分,分别用神经网络分析后再重组,以获得准确预测。
Figure 2. 分步流程:将空气数据按时间尺度拆分,分别用神经网络分析后再重组,以获得准确预测。

该方法的表现如何

在广州十一年的日 AQI 数据上测试,该框架明显优于多类对手,包括经典方法、标准递归网络和其他混合深度模型。它取得了较高的决定系数(R² 约为 0.96),均方误差约为一个强基线递归网络的三分之一,在三天或七天的前瞻预测中仍保持合理精度。通过逐步去除系统组件的消融试验显示,信号分解、卷积模块、双向记忆、注意力层以及基于狼群的调参均对最终性能有显著贡献。

这对日常生活意味着什么

对非专业读者来说,结论是作者构建了一种更聪明的方法,能读出城市雾霾记录中的隐含节律,并将其转化为可靠的次日 AQI 预报。该模型比现有工具更好地处理突发的快速污染波动和较长的季节性变化,并能在不完全重训的情况下较好地迁移到其他城市。尽管它对极端罕见事件仍有困难,并且在开发阶段需要较大计算投入,但一旦训练完成,其生成一次预测大约需要半秒钟。就实用性而言,这类系统可帮助城市发出更早、更精确的警报,让居民有更多时间调整户外活动并保护健康。

引用: Fang, Y., Liu, S. & Su, Z. Air quality index prediction using a hybrid CEEMDAN-CNN-IGWO-BiGRU-Attention model. Sci Rep 16, 15908 (2026). https://doi.org/10.1038/s41598-026-46978-w

关键词: 空气质量指数, 空气污染预测, 深度学习, 时间序列, 城市环境