Clear Sky Science · zh
基于机器学习的G20国家次国家城市温室气体排放估算(2000–2020)
为何城市排放与每个人息息相关
城市和地区处在应对气候变化的前线,有望实现大幅减少温室气体排放的目标。然而,对大多数城市而言,我们并不确切知道它们每年排放了多少污染物。该研究通过使用现代机器学习方法来填补这一盲点,估算世界最大经济体中数千个城市地区的年度致暖排放,为市民、规划者和决策者提供更清晰的图景,让他们知道哪些地方在取得进展、哪些地方尚未。
不断增长的承诺与数据缺口
在过去十年里,数千个地方政府承诺采取气候行动,许多地方还宣布了净零目标。但不到十分之一的城市定期报告详细的历年排放清单。已报告的城市在方法上各不相同,所涵盖的部门也有差异,有些只计算行政边界内的排放,而另一些则包括境外消费产生的排放。传统的替代做法,例如简单按人口或收入将国家排放分配到城市,会忽视地方努力并掩盖真实变化。其他格网化的全球数据集虽然一致性更好,但并不匹配地方决策者所依据的实际行政边界,限制了其在现实规划中的适用性。

由机器构建的新地图
作者构建了一个机器学习框架,估算2000年至2020年间近6,000个城市和100多个G20国家内地区的年度温室气体排放,这些国家合计约占全球排放的80%。他们收集了来自气候网络和政府平台的数千份自报清单,并对这些数据进行仔细清洗与标准化——检查重复条目、每人不合理的数值、突发的激增或骤降以及单位不一致等问题。每个城市或地区都使用全球行政区划数据库与官方行政边界进行匹配,以便预测值与现实的省、州、县和市等司法辖区对齐。
以太空与社会线索喂养模型
为了教会模型不同地区的排放模式,团队引入了多种公开可得的数据。这些数据包括基于卫星的化石燃料排放估算、按部门划分的排放地图、电力使用以及细颗粒物和二氧化氮等空气污染指标。他们还加入了人口、国内生产总值等社会经济指标,以及从气象数据推导出的采暖和制冷需求等气候相关度量。通过分区统计,他们在每个城市或地区边界内汇总所有这些图层,并将结果输入名为AutoGluon的自动化机器学习系统。该系统测试并组合多种基础模型,以最佳预测城市自报的排放数据。

估算的表现如何
在作为测试保留的排放数据上,模型解释了不同地点间大部分的差异,人口和收入成为最有影响力的驱动因素,其次是建筑物排放和用电量。研究者还将其估算与两套采用其他方法推导城市级或格网化排放的独立数据集进行了比较。对较大行政区的一致性最高,在更细尺度上仍保持相当好的一致性,但在输入数据稀缺或部门覆盖不完整的地区,差异会增大。通过为每次预测构建不确定性范围并检视不同模型组件间的分歧,作者表明最大的不确定性集中在报告最薄弱的地区,尤其是全球南部的部分地区。
这对气候行动意味着什么
最终成果是一套公开可用的数据集,包含了2000年至2020年间G20国家数千个次国家政府的年度排放数据,并提供了训练好的模型以便他人扩展。此类估算并非旨在取代城市自身编制的地方清单,而是作为在地方清单缺失、零散或不可比时的一个一致性基线。对居民、倡导者和决策者而言,这意味着他们现在可以查看特定城市和地区在二十年间的排放变化、识别热点并更好地追踪承诺是否转化为现实世界的减排效果。
引用: Yu, Y., Wang, X., Manya, D. et al. Machine learning estimates for G20 subnational urban GHG emissions from 2000–2020. Sci Data 13, 487 (2026). https://doi.org/10.1038/s41597-026-06691-9
关键词: 城市温室气体排放, 机器学习, G20城市, 气候数据, 次国家气候政策