Clear Sky Science · he

מאגר גורמי פליטה עולמי ליישומי למידת מכונה של היקף 3

· חזרה לאינדקס

מדוע מעקב אחר פחמן סמוי חשוב

רוב ההשפעה האקלימית של חברות מודרניות אינה נובעת מהפילטרים שלהן בלבד, אלא מש chained אספקה ארוכים ומסובכים — כל מה שהן קונות, מוכרות, למשלחות או מoutsourc'ות. פליטות אלה, המכונות "היקף 3", קשות במיוחד למעקב. המאמר מציג את ExioML, מאגר וערכת כלים פתוחים שממירים עשורים של רשומות כלכליות וסביבתיות מורכבות לנתונים מוכנים ללמידת מכונה. זה מקל משמעותית על חוקרים, מקבלי מדיניות ועסקים להעריך מהיכן הפליטות באמת נובעות, להשוות שיטות באופן הוגן ולעצב פתרונות אקלימיים חכמים יותר.

Figure 1
Figure 1.

לראות את הכלכלה העולמית כרשת

בראשית ExioML עומדת דרך להסתכל על הכלכלה העולמית כרשת ענקית של תעשיות הסוחרות זו עם זו מעבר לגבולות. במקום לספור רק כמה פחמן משתחרר בתוך מדינה, הגישה הזו עוקבת אחרי מסלול הפליטות לאורך שורות האספקה: מחומרי גלם, דרך מפעלים וחנויות, ועד לצרכנים. מאגרי נתונים קיימים שעושים זאת עוצמתיים אך לעיתים מאחורי חומות תשלום, קשים לשימוש או מיושנים. המחברים בונים על אחד המשאבים הפתוחים המפורטים ביותר, EXIOBASE, ומארגנים אותו מחדש כדי שכל אחד יוכל לשאול בקלות שאלות כמו: כמה גזי החממה קשורים לייצור פלדה במדינה ושנה נתונות, או כיצד פליטות באזור אחד מוטמעות במוצרים הנצרכים במקום אחר.

הפיכת מספרים גולמיים לנתונים מוכנים לשימוש

קבצי EXIOBASE הגולמיים ענקיים — יותר מ־40 גיגאבייט של טבלאות המתארות עסקאות בין מאות מגזרים בעשרות אזורים, בנוסף לרשומות מקבילות של פליטות, משאבים ושימוש אנרגיה. המחברים תכננו את ExioML כדי לעקור את המורכבות הזו לשני חלקים עיקריים. הראשון הוא טבלת "חשבונאות גורמים": גיליון מסודר שבו כל שורה מתייחסת למגזר מסוים באזור ובשנה מסוימת, עם עמודות לערך מוסף, מקומות עבודה, שימוש באנרגיה ותפוקת גזי חממה. השני הוא "רשת טביעת רגל": מפת זרימה ממוקדת של הקישורים המסחריים החזקים ביותר בין מגזרים, המראה כיצד כסף, אנרגיה ופליטות זורמים בכלכלה העולמית. ליצירת אלה הם מסתמכים על מעבדי גרפיקה (GPU) בעלי ביצועים גבוהים כדי לעבד את החישובים המטריציים התובעניים שעוקבים אחר הפליטות לאורך שורות האספקה, ומאחדים יחידות, קודי מגזרים ושמות כך שניתן להשוות ישירות את כל 49 האזורים ו‑28 השנים.

Figure 2
Figure 2.

בנוי עבור למידת מכונה מודרנית

ExioML תוכנן מראש עם מחשבה על למידת מכונה. המאגר מכסה 49 אזורים מ‑1995 עד 2022 ומציע שתי תצפיות תואמות: אחת מפורקת ל‑200 סוגי מוצרים ואחרת ל‑163 תעשיות. מבנה זה מאפשר לחוקרים להתייחס לכל צמדי מגזר–אזור–שנה כנקודת נתונים, ולשלב תכונות מספריות פשוטות — כמו אוכלוסייה, הכנסה לנפש, אנרגיה ליחידת תוצר או פליטות ליחידת אנרגיה — עם מידע קטגורי על המקום וסוג המגזר. המחברים מפרסמים גם חבילה בקוד פתוח שיכולה לטעון את הנתונים, ליצור סיכומי רשת ואפילו לספק חלוקות מוכנות של אימון, ולידציה ובדיקה. זה מוריד את החסם הן למדעני אקלים והן למדעני נתונים שרוצים לבנות מודלים בלי להפוך תחילה למומחים בחשבונאות כלכלית מיוחדת.

בדיקת יכולת המודלים לחזות פליטות

כדי להדגים שימוש ב‑ExioML, המחברים הקימו משימת בנצ'מרק: לחזות את פליטות גזי החממה של מגזר מתוך קבוצה קטנה של מדדים כלכליים וקשורי אנרגיה. הם השוו מודלים קלאסיים של למידת מכונה, כגון שכנוע על בסיס שכניהם הקרובים ועצים מבוססי אנסמבל, עם גישות למידה עמוקה מודרניות היכולות ללמוד באופן אוטומטי שילובי תכונות. אחרי ניקוי נתונים קפדני, סקיילינג וחלוקה, הם מצאו שמודלים ליניאריים פשוטים מתקשים, מה שמאשר שהיחסים בין ייצור, תעסוקה, שימוש באנרגיה ופליטות אינם ליניאריים. שיטות מבוססות עצים ורשתות נוירונים ביצעו היטב, כאשר מודל נוירוני עם שערים השיג את הדיוק הטוב ביותר. עם זאת, השיפור על פני עצי גרדיאנט־בוסט מותאמים היטב היה צנוע, בעוד שהמודלים העמוקים לקחו זמן רב יותר לאימון וקשה יותר לכוונן.

מה זה אומר לעבודה אקלימית ולעבודה עם נתונים

ללא־מומחים, המסר המרכזי הוא ש‑ExioML הופך מערבולת לא ברורה של נתונים כלכליים וסביבתיים גלובליים לבסיס משותף ופתוח שכל אחד יכול לבנות עליו. חברות שמנסות להבין את השפעת האקלים של רכישותיהן, חוקרים שמעצבים אלגוריתמים לזיהוי אזורי פליטה גבוהים, ואנליסטים החוקרים כיצד מדיניות או שינויים טכנולוגיים עשויים להזיז פליטות עתידיות — כולם יכולים לעבוד מאותו משאב שקוף. המחקר מראה שעם מבנה נכון, אפילו כלי למידת מכונה יחסית פשוטים יכולים ללכוד חלק גדול מהדפוס הסמוי של הפליטות בין מגזרים ואזורים. בשילוב פתיחות, מחויבות טכנית ותוכנה מעשית, ExioML מסייע להעביר את חשבונאות הפחמן מתפרחת של אומדנים פרטיים לעבר מדע נתוני־מונע, יותר ניתן לשחזור.

ציטוט: Guo, Y., Guan, C. & Ma, J. Global emission factor dataset for Scope 3 machine learning applications. Sci Data 13, 348 (2026). https://doi.org/10.1038/s41597-026-06699-1

מילות מפתח: פליטות היקף 3, חשבונאות פחמן, ניתוח קלט־פלט, למידת מכונה, פליטות בשרשרת האספקה