Clear Sky Science · tr
Scope 3 makine öğrenimi uygulamaları için küresel emisyon çarpanı veri seti
Neden Gizli Karbonu İzlemek Önemli
Modern şirketlerin iklim etkisinin büyük kısmı kendi bacalarından değil, uzun ve dolambaçlı tedarik zincirlerinden kaynaklanır—satın aldıkları, sattıkları, naklettikleri ve dış kaynak kullandıkları her şey. Bu sözde “Scope 3” emisyonları izlenmesi özellikle zordur. Makale, onlarca yıllık karmaşık ekonomik ve çevresel kayıtları makine öğrenimine hazır verilere dönüştüren açık bir küresel veri seti ve araç kiti olan ExioML’i tanıtıyor. Bu, araştırmacıların, politika yapıcıların ve şirketlerin emisyonların gerçekten nereden geldiğini tahmin etmelerini, yöntemleri adil şekilde karşılaştırmalarını ve daha akılcı iklim çözümleri tasarlamalarını çok daha kolay hale getiriyor.

Dünya Ekonomisini Bir Ağ Olarak Görmek
ExioML’in özünde dünya ekonomisini sınırları aşan sanayilerin birbirleriyle ticaret yaptığı devasa bir ağ olarak görme yöntemi yatıyor. Bir ülkede açığa çıkan karbonu saymak yerine bu yaklaşım emisyonların tedarik zincirleri boyunca izini sürüyor: hammaddeden fabrikalara, mağazalara ve nihayet tüketicilere. Bunu yapan mevcut veri tabanları güçlü olmakla birlikte genellikle ücretli erişimle sınırlı, kullanımı zor veya güncelliğini yitirmiş olabiliyor. Yazarlar en ayrıntılı açık kaynaklardan biri olan EXIOBASE üzerine inşa ediyor ve herkesin şu tür soruları kolayca sorabilmesini sağlayacak şekilde yeniden düzenliyor: belirli bir ülke ve yılda çelik üretimine ne kadar sera gazı bağlıdır veya bir bölgedeki emisyonlar başka yerde tüketilen ürünlere nasıl gömülüdür.
Ham Sayıları Kullanıma Hazır Veriye Dönüştürmek
Ham EXIOBASE dosyaları devasa—onlarca bölgedeki yüzlerce sektör arasındaki işlemleri, ayrıca emisyonlar, kaynaklar ve enerji kullanımına ilişkin paralel kayıtları tanımlayan 40 gigabayttan fazla tablo. Yazarlar bu karmaşıklığı iki ana parçaya indirgemek için ExioML’i tasarlıyor. Birincisi “çarpan muhasebesi” tablosu: her satırı belirli bir bölge ve yıl için belirli bir sektörü gösteren, katma değer, iş sayısı, enerji kullanımı ve sera gazı çıktısı sütunlarını içeren düzenli bir elektronik tablo. İkincisi “ayak izi ağı”: sektörler arasındaki en güçlü ticaret bağlantılarını gösteren, paranın, enerjinin ve emisyonların küresel ekonomi içinde nasıl aktığını yalın şekilde haritalayan bir özet. Bunu üretmek için yazarlar, tedarik zincirleri boyunca emisyonları izleyen yoğun matris hesaplamalarını çözmek üzere yüksek performanslı grafik işlem birimlerine (GPU’lar) dayanıyor ve tüm 49 bölge ile 28 yılın doğrudan karşılaştırılabilmesi için birimleri, sektör kodlarını ve isimlendirmeyi standartlaştırıyorlar.

Modern Makine Öğrenimi İçin İnşa Edildi
ExioML baştan sona makine öğrenimi düşünülerek tasarlandı. Veri seti 1995–2022 dönemini kapsayan 49 bölgeyi içeriyor ve birbirleriyle uyumlu iki görünüm sunuyor: biri 200 ürün türüne bölünmüş, diğeri 163 sanayiye ayrılmış. Bu yapı, araştırmacıların her sektör–bölge–yılı bir veri noktası olarak ele almasına, nüfus, kişi başına gelir, çıktı başına enerji, enerji başına emisyon gibi basit sayısal özellikleri sektörün nerede ve ne olduğuna dair kategorik bilgilerle birleştirmesine izin veriyor. Yazarlar ayrıca veriyi yükleyebilen, ağ özetleri üretebilen ve hazır eğitim, doğrulama ve test bölmeleri sağlayabilen açık kaynaklı bir yazılım paketi yayımlıyor. Bu, hem iklim bilimciler hem de veri bilimciler için özel ekonomik muhasebe uzmanı olmadan modeller kurma engelini düşürüyor.
Modellerin Emisyonları Ne Kadar İyi Tahmin Edebileceğini Test Etmek
ExioML’in nasıl kullanılabileceğini göstermek için yazarlar bir kıyaslama görevi kuruyor: küçük bir ekonomik ve enerjiyle ilgili gösterge setinden bir sektörün sera gazı emisyonunu tahmin etmek. En yakın komşular ve ağaç tabanlı topluluklar gibi klasik makine öğrenimi modellerini, otomatik olarak özellik kombinasyonları öğrenebilen modern derin öğrenme yaklaşımlarıyla karşılaştırıyorlar. Titiz veri temizleme, ölçekleme ve bölme sonrasında basit lineer modellerin zorlandığını görüyorlar; bu, üretim, iş, enerji kullanımı ve emisyon arasındaki ilişkinin yüksek derecede doğrusal olmayan olduğunu doğruluyor. Ağaç tabanlı yöntemler ve sinir ağları her ikisi de iyi performans gösteriyor; kapılı (gated) bir sinir modeli en iyi doğruluğa ulaşıyor. Ancak iyi ayarlanmış gradyan artırmalı ağaçlara kıyasla iyileşme ılımlı ve derin modellerin eğitimi çok daha uzun sürüyor ve ince ayarı daha zor.
İklim ve Veri Çalışması İçin Anlamı
Uzman olmayanlar için ana mesaj, ExioML’in küresel ekonomik ve çevresel verilerin opak karışıklığını herkesin üzerine inşa edebileceği paylaşılan, açık bir temele dönüştürdüğüdür. Satın almalarının iklim etkisini anlamaya çalışan şirketler, yüksek emisyonlu sıcak noktaları tespit edecek algoritmalar tasarlayan araştırmacılar ve politika ya da teknoloji değişikliklerinin gelecekteki emisyonları nasıl değiştirebileceğini inceleyen analistler hepsi aynı şeffaf kaynaktan çalışabilir. Çalışma gösteriyor ki doğru yapı ile nispeten basit makine öğrenimi araçları bile sektörler ve bölgeler arasındaki emisyonlardaki gizli desenin büyük bir kısmını yakalayabiliyor. Açıklık, teknik doğruluk ve pratik yazılımı birleştirerek ExioML, karbon hesaplamasını özel tahminlerden daha tekrarlanabilir, veri odaklı bir bilime taşımaya yardımcı oluyor.
Atıf: Guo, Y., Guan, C. & Ma, J. Global emission factor dataset for Scope 3 machine learning applications. Sci Data 13, 348 (2026). https://doi.org/10.1038/s41597-026-06699-1
Anahtar kelimeler: Scope 3 emisyonları, karbon hesaplaması, girdi–çıktı analizi, makine öğrenimi, tedarik zinciri emisyonları