Clear Sky Science · zh
结合傅里叶级数分解与LSTM和SVM的颗粒物(PM2.5 与 PM10)预测
为何更准确的空气预报与每个人息息相关
空气中的细颗粒是一种我们每天呼吸的无形威胁。称为PM2.5和PM10的微小颗粒能深入肺部并进入血液,增加心肺疾病的风险。然而污染水平可能在小时内剧烈波动。本研究探讨如何更精确地按小时和按季节预测这些涨落,在摩洛哥一座繁忙的港口城市里进行示范——以便当局在空气变得危险之前警示居民并制定应对措施。

理解城市空气中的尘埃
研究者把注意力放在莫哈梅迪亚(Mohammedia),这是一座沿大西洋的城市,拥有炼油厂和工业区,是空气质量研究的良好试验场。他们考察了两种常见的颗粒物:PM2.5(直径不超过2.5微米的更细颗粒)和PM10(直径可达10微米的稍大颗粒)。两者都能悬浮在空气中,被认为是对健康最有害的污染物之一。研究团队收集了从2020年12月到2021年11月的逐小时监测数据,构建了污染如何在日、周、季尺度上升落的详细记录。
清理杂乱的真实世界数据
和大多数真实监测系统一样,城市仪器并未提供完美的数据。有些小时的数据因传感器故障或通信问题而缺失,分布中也出现偶发的极端尖峰。作者没有简单地用直线插值填补空缺(那样可能会淡化真实的污染峰值),而是采用了一种考虑季节性的处理方法。他们首先捕捉到规律的日常模式——例如交通高峰时段的较高浓度——然后仅对剩余的非规律部分使用局部平滑进行填补。还把不同时间尺度上的重复模式(日、周、年)分离出来,并用异常检测技术标记和修正可疑的离群点。这种谨慎的清理旨在保留真实的污染事件,同时去除噪声。
让数学与机器共同发挥作用
研究的核心是经典数学与现代人工智能的结合。作者使用傅里叶级数这一工具——它能把复杂曲线分解为若干简单波形之和——将污染时间序列拆成趋势、季节性周期和剩余波动。随后,他们在这些处理过的信号上训练了两种常用的机器学习模型:支持向量机(SVM),通过灵活的曲线在数据中寻找模式;以及长短期记忆网络(LSTM),一种擅长从时间序列中学习的神经网络。将傅里叶预处理与每种模型结合的版本(SVMF 和 LSTMF)与仅用原始数据训练的版本进行了比较。

季节模式揭示了什么
逐小时记录显示了莫哈梅迪亚空气中明显的季节节律。对PM2.5而言,秋季平均浓度最高,晚间和夜间的峰值持续较长,约从晚上7点延续到凌晨2点,这可能与交通、商业和社交活动有关。冬季和夏季也出现明显的晚间和深夜峰值,而春季表现为两个主要波峰:一个出现在午后早些时候,另一个在傍晚。PM10的大体模式相似,以傍晚峰值为主,多数季节白天浓度相对较低。这些模式强调,空气最糟糕的时段常与多数人外出或通勤的时间相重合。
用分解信号获得更准确的预报
在四个季节和两种污染物中,结合傅里叶分解与机器学习的混合模型普遍优于仅用原始数据训练的模型。将LSTM与傅里叶预处理相结合的LSTMF模型始终表现最佳。在逐小时预报中,它在每个季节的准确性都名列前茅,秋季表现尤为突出。将预测期延长到7天时,LSTMF仍保持较高的技能,很多情况下决定系数(R²)接近或超过0.9。简单来说,分解信号帮助模型聚焦于有意义的结构——长期趋势和周期性变化——同时更好地处理短期噪声。
这对日常生活意味着什么
对非专业读者而言,关键结论是更智能的预报可以把原始传感器数据转化为切实可行的保护措施。通过更准确地预测逐小时PM2.5和PM10浓度,城市规划者和卫生机构可以预见污染何时会激增,向呼吸系统脆弱的人群发出警报,调整交通流或在恰当时机实施工业限令。尽管本研究只关注一座摩洛哥城市,并且仅使用了历史颗粒物测量值(未引入气象或排放数据),但它表明将深度学习与数学分解相结合,是实现更清洁、更可靠空气质量预报的有力办法。经过进一步改进并推广到更多地点,这类工具可支撑早期预警系统,帮助人们在日常生活中更安心地呼吸。
引用: Bennis, M., Youssfi, M., Morabet, R.E. et al. Particulate matter (PM2.5 and PM10) prediction using fourier series decomposition in combination with LSTM and SVM. Sci Rep 16, 7665 (2026). https://doi.org/10.1038/s41598-026-38436-4
关键词: 空气污染预报, 颗粒物, 机器学习, 傅里叶分解, 城市空气质量