Clear Sky Science · ar
مجموعة بيانات عالمية لعوامل الانبعاث لتطبيقات التعلم الآلي لنطاق 3
لماذا يهم تتبُّع الكربون المخفي
تأتي معظم الآثار المناخية للشركات الحديثة ليس من مداخنها نفسها، بل من سلاسل التوريد الطويلة والمعقّدة — كل ما تشتريه وتبيعه وتشحنه وتتفوضه. تُعد هذه الانبعاثات المسماة «النطاق 3» صعبة التتبُّع بشكل ملحوظ. تُقدّم الورقة ExioML، وهي مجموعة بيانات وأداة مفتوحة عالمية تحول عقوداً من السجلات الاقتصادية والبيئية المعقّدة إلى بيانات جاهزة للاستخدام في نماذج التعلم الآلي. هذا يُسهّل على الباحثين وصناع السياسات والشركات تقدير مصادر الانبعاثات الحقيقية، ومقارنة الطرق بعدالة، وتصميم حلول مناخية أذكى.

رؤية الاقتصاد العالمي كشبكة
في صميم ExioML نهج ينظر إلى الاقتصاد العالمي على أنه شبكة عملاقة من الصناعات التي تتبادل التجارة عبر الحدود. بدلاً من عد الكربون المنبعث داخل بلد فقط، يتتبع هذا النهج أثر الانبعاثات على طول سلاسل التوريد: من المواد الخام، إلى المصانع، إلى المتاجر، وأخيراً إلى المستهلكين. قواعد البيانات الحالية التي تقوم بذلك قوية لكنها غالباً ما تكون محجوبة وراء جدران مدفوعة، أو صعبة الاستخدام، أو قديمة. يبني المؤلفون على أحد أكثر المصادر المفتوحة تفصيلاً، EXIOBASE، ويعيدون تنظيمه بحيث يمكن لأي شخص أن يطرح بسهولة أسئلة مثل: ما مقدار غازات الدفيئة المرتبطة بإنتاج الصلب في بلد وسنة معينين، أو كيف تتضمّن المنتجات المستهلكة في مكان ما انبعاثات من مناطق أخرى.
تحويل الأرقام الخام إلى بيانات جاهزة للاستخدام
ملفات EXIOBASE الخام ضخمة — أكثر من 40 غيغابايت من الجداول التي تصف المعاملات بين مئات القطاعات في عشرات المناطق، بالإضافة إلى سجلات موازية للانبعاثات والموارد واستهلاك الطاقة. صمّم المؤلفون ExioML لتقطير هذه التعقيدات إلى جزأين رئيسيين. الأول هو جدول «محاسبة العوامل»: ورقة منظمة بعناية حيث كل صف يمثل قطاعاً محدداً في منطقة وسنة محددتين، مع أعمدة للقيمة المضافة، والوظائف، واستهلاك الطاقة، ومخرجات غازات الدفيئة. الثاني هو «شبكة البصمة»: خريطة مبسطة لأقوى روابط التجارة بين القطاعات، تُظهر كيف تتدفق الأموال والطاقة والانبعاثات عبر الاقتصاد العالمي. لإنتاج هذه العناصر، يعتمدون على وحدات معالجة رسومية عالية الأداء (GPUs) لحل حسابات المصفوفات المكثفة التي تتتبع الانبعاثات عبر سلاسل التوريد، ويقومون بتوحيد الوحدات، ورموز القطاعات، والتسميات بحيث يمكن مقارنة جميع المناطق الـ49 والسنوات الـ28 بشكل مباشر.

مصمَّم للتعلم الآلي الحديث
تم تصميم ExioML من الأساس مع مراعاة التعلم الآلي. تغطي مجموعة البيانات 49 منطقة من 1995 إلى 2022 وتقدّم وجهتين متوافقتين: إحداهما مقسمة إلى 200 نوع من المنتجات والأخرى إلى 163 صناعة. تتيح هذه البنية للباحثين معالجة كل زوج قطاع‑منطقة‑سنة كنقطة بيانات، بدمج ميزات رقمية بسيطة — مثل عدد السكان، ودخل الفرد، والطاقة لكل وحدة إنتاج، أو الانبعاثات لكل وحدة طاقة — مع معلومات فئوية عن المكان ونوع القطاع. كما ينشر المؤلفون حزمة برمجية مفتوحة المصدر يمكنها تحميل البيانات، وتوليد ملخصات الشبكة، وحتى توفير تقسيمات جاهزة للتدرّب والتحقّق والاختبار. هذا يخفض الحاجز لكل من علماء المناخ وعلماء البيانات الذين يرغبون في بناء نماذج دون الحاجة لأن يصبحوا خبراء في المحاسبة الاقتصادية المتخصصة أولاً.
اختبار قدرة النماذج على التنبؤ بالانبعاثات
لإظهار كيفية استخدام ExioML، وضع المؤلفون مهمة معيارية: التنبؤ بانبعاثات غازات الدفيئة لقطاع ما من مجموعة صغيرة من المؤشرات الاقتصادية والمتعلقة بالطاقة. يقارنون نماذج التعلم الآلي الكلاسيكية، مثل الجيران الأقرب والغابات الشجرية المعتمِدة على التجميع، بطرق التعلم العميق الحديثة التي يمكنها تعلم تراكيب الميزات تلقائياً. بعد تنظيف البيانات بعناية، والتحجيم، والتقسيم، وجدوا أن النماذج الخطية البسيطة تكافح، مؤكدة أن العلاقة بين الإنتاج والوظائف واستهلاك الطاقة والانبعاثات غير خطية بدرجة كبيرة. أدت أساليب التجميع الشجري والشبكات العصبية أداءً جيداً، حيث حقق نموذج عصبي ذو بوابات أفضل دقة. ومع ذلك، فإن التحسّن مقارنةً بأشجار التعزيز التدرجي المحسنة جيداً كان متواضعاً، في حين أن النماذج العميقة تستغرق وقتاً أطول بكثير للتدريب وتكون أصعب في الضبط الدقيق.
ما يعنيه هذا لعمل المناخ والبيانات
لغير المتخصصين، الرسالة الأساسية هي أن ExioML يحوّل تشابكاً غامضاً من البيانات الاقتصادية والبيئية العالمية إلى أساس مشترك ومفتوح يمكن لأي شخص البناء عليه. الشركات التي تحاول فهم الأثر المناخي لمشترياتها، والباحثون الذين يصممون خوارزميات لرصد بؤر الانبعاثات العالية، والمحللون الذين يستكشفون كيف قد تغيّر السياسات أو التكنولوجيا الانبعاثات المستقبلية، يمكنهم جميعاً العمل من نفس المورد الشفاف. تُظهر الدراسة أنه بالهيكلة الصحيحة، يمكن حتى لأدوات التعلم الآلي البسيطة نسبياً أن تلتقط جزءاً كبيراً من الأنماط الخفية في الانبعاثات عبر القطاعات والمناطق. من خلال الجمع بين الانفتاح، والدقة الفنية، والبرمجيات العملية، تساعد ExioML في نقل محاسبة الكربون من رقع تقييمات خاصة متفرقة نحو علم أقوى قابل للتكرار ومدعوم بالبيانات.
الاستشهاد: Guo, Y., Guan, C. & Ma, J. Global emission factor dataset for Scope 3 machine learning applications. Sci Data 13, 348 (2026). https://doi.org/10.1038/s41597-026-06699-1
الكلمات المفتاحية: انبعاثات النطاق 3, محاسبة الكربون, تحليل المدخلات‑المخرجات, التعلم الآلي, انبعاثات سلسلة التوريد