Clear Sky Science · pt
Estimativas por aprendizado de máquina das emissões urbanas subnacionais de GEE do G20 de 2000 a 2020
Por que as emissões das cidades importam para todos
Cidades e regiões estão na linha de frente das mudanças climáticas e se comprometeram a reduzir substancialmente a poluição por gases de efeito estufa. Ainda assim, para a maioria delas não sabemos com segurança quanto emitem a cada ano. Este estudo aborda essa lacuna ao usar técnicas modernas de aprendizado de máquina para estimar emissões anuais que aquecem o clima em milhares de áreas urbanas das maiores economias do mundo, oferecendo a cidadãos, planejadores e formuladores de políticas uma visão mais clara de onde há progresso — e onde não há.
A promessa crescente e a lacuna de dados
Na última década, milhares de governos locais assumiram compromissos climáticos e muitos anunciaram metas de emissão líquida zero. Mas menos de uma em cada dez autoridades tem divulgado inventários de emissões detalhados e regulares ao longo do tempo. Quando as cidades reportam, os métodos variam, os setores incluídos são diferentes e algumas contabilizam apenas as emissões dentro de seus limites, enquanto outras incluem o que é consumido em outros lugares. Soluções tradicionais, como simplesmente repartir as emissões nacionais para as cidades usando população ou renda, deixam de captar esforços locais e obscurecem mudanças reais. Outros conjuntos de dados globais em grade oferecem consistência, mas não coincidem com os limites reais onde líderes locais tomam decisões, limitando sua utilidade para o planejamento prático.

Um novo mapa construído por máquinas
Os autores desenvolvem uma estrutura de aprendizado de máquina para estimar emissões anuais de gases de efeito estufa de 2000 a 2020 para quase 6.000 cidades e mais de 100 regiões nos países do G20, que juntos respondem por cerca de 80% das emissões globais. Eles reúnem milhares de inventários auto-relatados de redes climáticas e plataformas governamentais e os limpam e padronizam com cuidado — verificando entradas duplicadas, valores por pessoa implausíveis, picos ou quedas súbitos e unidades inconsistentes. Cada cidade ou região é vinculada a um limite administrativo oficial usando o Global Administrative Areas Database, para que as previsões correspondam a jurisdições reais, como províncias, estados, condados e municípios.
Alimentando o modelo com pistas do espaço e da sociedade
Para ensinar ao modelo como diferentes lugares emitem, a equipe incorpora uma ampla gama de dados publicamente disponíveis. Isso inclui estimativas por satélite de emissões de combustíveis fósseis, mapas setoriais de emissões, consumo de eletricidade e poluição atmosférica, como partículas finas e dióxido de nitrogênio. Acrescentam-se indicadores socioeconômicos, como população e produto interno bruto, além de medidas relacionadas ao clima, como necessidades de aquecimento e resfriamento derivadas de dados meteorológicos. Usando estatísticas zonares, eles resumem todas essas camadas dentro de cada limite municipal ou regional e as alimentam em um sistema automatizado de aprendizado de máquina chamado AutoGluon. Esse sistema testa e combina múltiplos modelos subjacentes para prever da melhor forma as emissões que as próprias cidades reportaram.

Desempenho das estimativas
Nos dados de emissões reservados para teste, o modelo explica a maior parte da variação entre diferentes locais, com população e renda surgindo como os fatores mais influentes, seguidos por emissões de edifícios e consumo de eletricidade. Os pesquisadores também comparam suas estimativas com dois conjuntos de dados independentes que usam outros métodos para derivar emissões em nível de cidade ou em grade. A concordância é mais forte para áreas administrativas maiores e permanece razoavelmente boa em escalas mais finas, embora as diferenças aumentem onde os dados de entrada são escassos ou a cobertura setorial é incompleta. Ao construir intervalos de incerteza em torno de cada previsão e examinar como componentes distintos do modelo discordam, os autores mostram que as maiores incertezas se concentram em regiões com os relatórios mais fracos, particularmente em partes do Sul Global.
O que isso significa para a ação climática
O produto final é um conjunto de dados publicamente disponível com emissões anuais para milhares de governos subnacionais nos países do G20 de 2000 a 2020, junto com o modelo treinado para que outros possam estendê‑lo. Essas estimativas não têm a intenção de substituir inventários locais produzidos pelas próprias cidades, mas de funcionar como uma linha de base consistente onde tais inventários faltam, são fragmentados ou não comparáveis. Para moradores, defensores e tomadores de decisão, isso significa que agora é possível ver como as emissões mudaram ao longo de duas décadas para cidades e regiões específicas, identificar pontos críticos e acompanhar melhor se as promessas estão se traduzindo em cortes reais na poluição climática.
Citação: Yu, Y., Wang, X., Manya, D. et al. Machine learning estimates for G20 subnational urban GHG emissions from 2000–2020. Sci Data 13, 487 (2026). https://doi.org/10.1038/s41597-026-06691-9
Palavras-chave: emissões urbanas de gases de efeito estufa, aprendizado de máquina, cidades do G20, dados climáticos, política climática subnacional