Clear Sky Science · fr

Estimations par apprentissage automatique des émissions urbaines de GES au niveau infranational pour le G20 de 2000 à 2020

2026-02-19 · Retour à l’index

Pourquoi les émissions des villes concernent tout le monde

Les villes et les régions sont en première ligne face au changement climatique et promettent des réductions profondes des pollutions par gaz à effet de serre. Pourtant, pour la plupart, nous ignorons avec certitude combien elles émettent chaque année. Cette étude s’attaque à cette zone d’ombre en utilisant des méthodes modernes d’apprentissage automatique pour estimer les émissions annuelles favorisant le réchauffement climatique de milliers d’aires urbaines dans les plus grandes économies mondiales, offrant ainsi aux citoyens, planificateurs et décideurs une image plus claire des endroits où des progrès sont réalisés — et de ceux où ils ne le sont pas.

La promesse croissante et le déficit de données

Au cours de la dernière décennie, des milliers de gouvernements locaux ont pris des engagements climatiques, et nombre d’entre eux ont annoncé des objectifs de neutralité carbone. Mais moins d’un sur dix publie régulièrement des inventaires d’émissions détaillés sur la durée. Lorsque les villes publient, leurs méthodes diffèrent, les secteurs inclus varient, et certaines ne comptent que les émissions à l’intérieur de leurs frontières tandis que d’autres intègrent la consommation effectuée ailleurs. Les solutions traditionnelles, comme l’application d’un simple facteur de réduction des totaux nationaux en fonction de la population ou du revenu, passent à côté des efforts locaux et masquent les changements réels. D’autres jeux de données mondiaux en grille garantissent la cohérence mais ne correspondent pas aux limites réelles où les responsables locaux prennent des décisions, ce qui limite leur utilité pour la planification concrète.

Une nouvelle carte construite par des machines

Les auteurs développent un cadre d’apprentissage automatique pour estimer les émissions annuelles de gaz à effet de serre de 2000 à 2020 pour près de 6 000 villes et plus de 100 régions des pays du G20, qui représentent ensemble environ 80 % des émissions mondiales. Ils rassemblent des milliers d’inventaires auto-déclarés issus de réseaux climatiques et de plateformes gouvernementales, puis les nettoient et les standardisent soigneusement — vérifiant les doublons, les valeurs par personne implausibles, les pics ou baisses soudains et les unités incohérentes. Chaque ville ou région est appariée à une limite administrative officielle à l’aide de la base de données Global Administrative Areas, de sorte que les prédictions s’alignent sur des juridictions réelles comme les provinces, états, comtés et municipalités.

Alimenter le modèle avec des indices venus de l’espace et de la société

Pour apprendre au modèle comment différents lieux émettent, l’équipe intègre une large gamme de données publiques. Celles-ci comprennent des estimations satellitaires des émissions fossiles, des cartes sectorielles d’émissions, la consommation d’électricité et la pollution de l’air comme les particules fines et le dioxyde d’azote. Ils ajoutent des indicateurs socioéconomiques tels que la population et le produit intérieur brut, ainsi que des mesures liées au climat comme les besoins de chauffage et de refroidissement dérivés des données météorologiques. À l’aide de statistiques zonales, ils résument toutes ces couches à l’intérieur de chaque limite urbaine ou régionale et les injectent dans un système d’apprentissage automatique automatisé appelé AutoGluon. Ce système teste et combine plusieurs modèles sous-jacents pour prédire au mieux les émissions que les villes ont elles-mêmes rapportées.

Performances des estimations

Sur les données d’émissions réservées pour les tests, le modèle explique la majeure partie de la variation entre les différents lieux, la population et le revenu apparaissant comme les facteurs les plus influents, suivis des émissions des bâtiments et de la consommation électrique. Les chercheurs comparent également leurs estimations à deux jeux de données indépendants qui utilisent d’autres méthodes pour dériver des émissions au niveau des villes ou en grille. L’accord est le plus fort pour les grandes zones administratives et reste raisonnablement bon à des échelles plus fines, bien que les divergences augmentent là où les données d’entrée sont rares ou la couverture sectorielle incomplète. En construisant des intervalles d’incertitude autour de chaque prédiction et en examinant les désaccords entre différentes composantes du modèle, les auteurs montrent que les incertitudes les plus importantes se concentrent dans les régions où la publication de données est la plus faible, en particulier dans certaines parties du Sud global.

Ce que cela signifie pour l’action climatique

Le produit final est un jeu de données public d’émissions annuelles pour des milliers de gouvernements infranationaux des pays du G20 de 2000 à 2020, ainsi que le modèle entraîné pour que d’autres puissent l’étendre. Ces estimations ne visent pas à remplacer les inventaires locaux produits par les villes elles‑mêmes, mais plutôt à servir de référence cohérente là où ces inventaires font défaut, sont fragmentaires ou non comparables. Pour les habitants, les militants et les décideurs, cela signifie qu’ils peuvent désormais voir comment les émissions ont évolué sur deux décennies pour des villes et régions spécifiques, identifier les points chauds et mieux suivre si les engagements se traduisent par des réductions réelles de la pollution climatique.

Citation: Yu, Y., Wang, X., Manya, D. et al. Machine learning estimates for G20 subnational urban GHG emissions from 2000–2020. Sci Data 13, 487 (2026). https://doi.org/10.1038/s41597-026-06691-9

Mots-clés: émissions de gaz à effet de serre urbaines, apprentissage automatique, villes du G20, données climatiques, politique climatique infranationale