Clear Sky Science · ja

スコープ3機械学習応用のための世界的排出係数データセット

· 一覧に戻る

見えない炭素を追う重要性

現代企業の気候影響の大部分は、自社の煙突から出るものではなく、長く複雑に絡み合ったサプライチェーン──彼らが購入し、販売し、輸送し、外注するあらゆるもの──に由来します。いわゆる「スコープ3」排出量は追跡が notoriously(非常に)難しいことで知られています。本論文はExioMLを紹介します。これは、複雑な経済および環境の記録を機械学習で扱えるデータに変換する、オープンな世界規模のデータセットとツールキットです。研究者、政策立案者、企業が実際にどこから排出が生じているかを推定し、手法を公平に比較し、より賢い気候対策を設計することを格段に容易にします。

Figure 1
Figure 1.

世界経済を網の目として見る

ExioMLの核は、世界経済を国境を越えて互いに取引する産業の巨大な網として見る方法です。国内でどれだけの二酸化炭素が放出されたかを単に数えるのではなく、このアプローチは原材料から工場、店舗、そして最終消費者へと続くサプライチェーンに沿った排出の足跡をたどります。この種の分析を行う既存のデータベースは強力ですが、有料であったり使いにくかったり古くなっていたりすることが多いのが現状です。著者らは最も詳細なオープン資源の一つであるEXIOBASEを基盤にし、それを再構成して、ある国と年における鉄鋼生産に結びつく温室効果ガス量や、ある地域の排出が他の地域で消費される製品にどのように組み込まれているかといった問いに誰でも簡単に答えられるようにしています。

生データを利用可能なデータに変換する

生のEXIOBASEファイルは巨大です──数十の地域にまたがる数百の部門間取引を記述するテーブルと、排出量、資源、エネルギー使用の並列記録で40ギガバイトを超えます。著者らはこの複雑さを主に二つの要素に蒸留するようExioMLを設計しました。第一は「係数会計」テーブル:各行が特定の地域・部門・年を表し、付加価値、雇用、エネルギー使用、温室効果ガス排出量などの列を持つ整然としたスプレッドシートです。第二は「フットプリント・ネットワーク」:部門間の最も強い貿易リンクを簡潔に示す地図で、資金、エネルギー、排出が世界経済を通じてどのように流れるかを表します。これらを生成するために、著者らはサプライチェーンに沿った排出を追跡する高負荷な行列計算を処理する高性能なグラフィックス処理装置(GPU)を活用し、単位、部門コード、名称を標準化することで49地域と28年間を直接比較できるようにしています。

Figure 2
Figure 2.

現代の機械学習に適した設計

ExioMLは機械学習を念頭に置いて一から設計されています。データセットは1995年から2022年までの49地域をカバーし、200種類の製品に分割したビューと163産業に分割した互換性ある二つのビューを提供します。この構成により、研究者は各部門–地域–年をデータポイントとして扱い、人口、1人当たり所得、生産単位当たりのエネルギー、エネルギー単位当たりの排出などの単純な数値特徴と、部門の所在地や種別といったカテゴリ情報を組み合わせることができます。著者らはデータを読み込み、ネットワーク要約を生成し、学習・検証・テスト用の分割をあらかじめ用意するオープンソースのソフトウェアパッケージも公開しています。これにより、専門的な経済会計の専門家にならなくともモデルを構築したい気候科学者やデータサイエンティストの障壁が下がります。

モデルが排出をどれだけ予測できるかの検証

ExioMLの利用例を示すため、著者らはベンチマーク課題を設定しました:限られた経済・エネルギー関連指標から部門の温室効果ガス排出を予測することです。彼らは最近傍法やツリー系アンサンブルなどの古典的機械学習モデルと、特徴の組合せを自動的に学習できる現代の深層学習手法を比較しました。慎重なデータクリーニング、スケーリング、分割の後、単純な線形モデルは苦戦することが分かり、生産、雇用、エネルギー使用、排出の関係が高度に非線形であることが裏付けられました。ツリー系手法とニューラルネットワークはいずれも良好な性能を示し、ゲート付きニューラルモデルが最高の精度を達成しました。ただし、十分に調整した勾配ブースティングツリーに対する改善は控えめであり、深層モデルは学習に時間がかかり、微調整も難しいという欠点があります。

気候とデータ研究にとっての意義

非専門家にとっての重要なメッセージは、ExioMLが不透明な世界的経済・環境データの入り組んだ束を、誰もが基盤として利用できる共有のオープンな基盤に変えるという点です。購買の気候影響を把握しようとする企業、高排出のホットスポットを検出するアルゴリズムを設計する研究者、政策や技術の変化が将来の排出にどのように影響するかを探る分析者──いずれも同じ透明な資源から作業できます。本研究は、適切な構造があれば比較的単純な機械学習ツールでも部門や地域を横断する排出の隠れたパターンの多くを捉えられることを示しています。オープン性、技術的厳密さ、実用的なソフトウェアを組み合わせることで、ExioMLは炭素会計を民間の見積りの寄せ集めから、より再現可能でデータ駆動な科学へと前進させる助けとなります。

引用: Guo, Y., Guan, C. & Ma, J. Global emission factor dataset for Scope 3 machine learning applications. Sci Data 13, 348 (2026). https://doi.org/10.1038/s41597-026-06699-1

キーワード: スコープ3排出量, 炭素会計, 入出力分析, 機械学習, サプライチェーン排出量