Clear Sky Science · zh

利用GEMS卫星数据融合预测台湾逐小时空气质量

· 返回目录

为什么更清晰的空气图对日常生活很重要

空气污染通常由分布稀疏的监测站网络来跟踪,这会遗漏污染热点,让许多社区对自身实际呼吸的空气状况一无所知。本研究通过将一颗新的静止轨道卫星的数据与气象和地面传感器数据相结合,并利用机器学习预测六种主要污染物的逐小时浓度,解决了覆盖全台湾的这一问题。其结果是一种高分辨率、近实时的空气质量地图,可帮助居民、医生和决策者更快应对变化的污染状况,更好地保护公众健康。

Figure 1
Figure 1.

空中新增的观察之眼

这项工作以地球静止环境监测光谱仪(GEMS)为核心——它是于2020年发射、悬停于东亚上空的卫星仪器。不同于只在一天中经过一两次的传统卫星,GEMS在白天持续监测同一区域,追踪与烟雾和能见度下降相关的气体与气溶胶。研究人员利用了其对臭氧、二氧化氮、二氧化硫以及气溶胶属性的测量,并将这些数据与详尽的气象信息、紫外辐射数据以及台湾地面空气质量网络的观测结合起来。所有这些数据都被重采样到覆盖全岛的统一网格上,按小时排列,分辨率足以区分区域性模式。

教会模型跟踪我们呼吸的空气

为了把这些海量数据转化为实用的预报,团队采用了一种名为CatBoost的机器学习方法,它擅长在复杂且混合类型的数据中发现规律。关键在于,他们没有为每种污染物分别构建模型,而是训练了一个能同时输出多种污染物的“多输出”模型,联合学习六种污染物的行为——细颗粒物(PM₂.₅)、粗颗粒物(PM₁₀)、臭氧(O₃)、二氧化氮(NO₂)、一氧化碳(CO)和二氧化硫(SO₂)。模型输入不仅包括当前的卫星和气象条件,还包括前一小时和前两小时以及前一天同一小时的信息,帮助其识别短期波动和昼夜周期。为模拟实际预报的使用方式,研究采用滚动训练:模型反复在最近18个月的数据上重新训练,然后预测未来一天,在2023年的六个月测试期内进行验证。

系统追踪台湾雾霾的效果如何

模型在多方面证明了其能够较好地追踪台湾的空气污染。统计指标显示,模型预测值与观测值在大多数污染物上具有较强的一致性,尤其是臭氧、粗颗粒物、细颗粒物、二氧化氮和一氧化碳。将模型输出与台湾各监测站读数对比的地图表明,系统能良好再现广泛的空间格局,仅在局部出现高估或低估。对误差的深入分析指出,一些极端的颗粒物污染事件(如PM₂.₅和PM₁₀的突发激增)会扭曲对异常值敏感的某些统计量。当改用更稳健的统计方法汇总这些误差时,颗粒物的表观性能显著提高,这表明模型在日常条件下总体表现良好,但像许多模型一样,对罕见的强烈事件处理较为吃力。

Figure 2
Figure 2.

岛上污染格局的驱动因素

为了解模型学到了什么,研究人员应用了一种方法,对每种污染物的重要输入进行排序。对于臭氧来说,强烈的阳光和较高的气温会推动其上升,而湿度较高则倾向于降低臭氧——这与植物和天气影响臭氧去除的方式相符。对于颗粒物污染来说,更高的风速通常通过扩散污染物来降低浓度,而卫星衍生的气溶胶信号则会提高颗粒物水平。类似氮氧化物、一氧化碳和二氧化硫等一次污染物,则由时间、地点与日照等因素共同决定,紫外辐射通过分解二氧化氮并参与臭氧生成而降低二氧化氮含量。总体而言,分析显示卫星测量与气象数据共同为模型提供了物理上合理的图景,描述了污染物在台湾复杂岛屿环境中的生成、运输与衰减过程。

对公众与政策的意义

简而言之,研究表明,通过在单一学习框架中融合卫星观测、气象数据和地面监测,可以生成覆盖全台湾的多种污染物的逐小时可靠地图,而不仅限于有站点的地方。尽管在某些污染物和极端事件上的表现还有改进空间,这一方法已为公共卫生官员和城市规划者提供了强有力的工具:它可以在空气质量恶化时发布更精确的警报、改进用于健康研究的长期暴露估计,并支持针对最有害的污染与天气组合制定更智能的监管措施。同样的策略也可推广到其他被静止轨道卫星覆盖的地区,为更多社区带来更清晰、更及时的空气质量信息。

引用: Lin, WH., Chan, TC. GEMS satellite data fusion for hourly air quality prediction in Taiwan. Sci Rep 16, 7766 (2026). https://doi.org/10.1038/s41598-026-39305-w

关键词: 空气质量预测, 卫星遥感, 台湾空气污染, 机器学习模型, GEMS卫星