Clear Sky Science · ja
コルモゴロフ–アーノルドネットワークを用いた熱電材料設計の可解釈な機械学習
熱を有用な電力に変える
自動車のエンジンや工場、さらには私たちの電子機器からも、日々膨大なエネルギーが廃熱として失われています。熱電材料は、可動部や燃料を使わずにその廃熱の一部を直接電力に変換する手段を提供します。しかし、効率的な新材料を見つけるのは困難です。というのも、性能は密接に関連した複数の電子的性質に依存するからです。本研究は、材料の性能を予測するだけでなく、その理由を説明できる新しい種類の人工知能を検討し、より良い熱電化合物を設計するための明確な道筋を開きます。

なぜより良い熱電材料は見つけにくいのか
熱電デバイスは、一方が高温でもう一方が低温のときに電圧を生む材料に依存します。その効率は zT と呼ばれる指標で表され、主に三つの要素に依存します:温度に対するキャリアの応答の強さ(ゼーベック係数)、キャリアの移動のしやすさ(電気伝導度)、および材料が熱を伝える度合い(熱伝導度)。ある性質を改善すると別の性質が損なわれることが多く、例えば電気伝導を高めると熱伝導も高くなり効率が低下することがあります。密度汎関数理論などの従来の量子力学的シミュレーションは原子構造からこれらの性質を予測できますが、計算コストが非常に高いため、何百万もの候補材料に適用することはできません。
ブラックボックスモデルと洞察の必要性
近年、機械学習モデルは過去のシミュレーションや実験に基づいて材料特性を迅速に推定する強力なツールになっています。本研究では、まず結晶中の原子配置や相互作用を捉える専用の「Crystalformer」エンコーダが生成する詳細な数値記述から出発します。著者らは最初に、ゼーベック係数と電荷キャリアの扱いやすさに影響するもう一つの重要量である電子バンドギャップを予測するために、標準的な多層パーセプトロン(一般的な深層学習モデル)を訓練します。このモデルは約15,000化合物の大規模データセットで両方のタスクに高い精度を示します。しかし、多くの深層ネットワークと同様に、このモデルはブラックボックス的であり、どの構造特徴が実際に重要なのか、あるいはそれらがどのように組み合わさって熱電応答を制御しているのかについてほとんど示唆を与えません。
異なる種類のニューラルネットワーク
本論文の中心的アイデアは、不透明なニューラルネットワークの代わりにコルモゴロフ–アーノルドネットワーク(KAN)を導入することです。全ての複雑さをニューロンの活性化の中に隠す代わりに、KANは層間の接続に柔軟な1次元の曲線状関数を付与します。数学的には、これらの曲線はデータに適応する滑らかなスプラインであり、全体のモデルは入力記述子の単純な関数の和として表現できます。訓練後、著者らは学習されたスプラインに対して、正弦・余弦や滑らかな飽和曲線のような馴染みのある関数で構成される簡潔な数学式を当てはめます。こうしてモデルは、多数の不透明なパラメータのもつれではなく、構造記述子をバンドギャップやゼーベック係数に結びつける明示的な記号式になります。KANは訓練にやや計算コストがかかるものの、多層パーセプトロンや文献中の他のいくつかの機械学習ベースラインと同等、あるいは一部の領域ではそれ以上の精度を達成します。

モデルが材料について学んだこと
KANの内部構造を詳しく調べることで、著者らは128の構造記述子のうちごく一部だけが各特性に強く影響することを示します。彼らはアトリビューションスコアを計算して重要な記述子を特定し、弱い結合を剪定してまばらで解釈しやすいネットワークを残しますが、予測性能は維持されます。上位の記述子の組み合わせを用いて、予測されるバンドギャップやゼーベック係数が記述子空間でどのように変化するかを示す2次元マップを作成します。これらのマップは、単純な一対一の規則ではなく、振動的な傾向と飽和的な傾向が組み合わさった滑らかで協調的な効果を明らかにします。化学的には、著者らは方向性の強い結合や強く相互作用するd・f電子を含む複雑な系で最も苦戦しますが、そうした領域でもKANはブラックボックスモデルより安定的で物理的に妥当な予測を出します。例えば、非物理的な負のバンドギャップや誤った符号のゼーベック値を出す頻度が少なくなります。
予測から指針ある設計へ
KANは単なる数値予測ではなく明示的で滑らかな式を出力するため、基になる記述子を変えたときに熱電性能がどのように変化するかを探索するのに使えます。これらの記述子は深い構造エンコーダから導かれる抽象的な量ではありますが、原子配列や結合の実際の特徴と相関しています。つまり研究者は、解析的なKANモデルを一種の地図として用い、高いゼーベック係数と適切なバンドギャップが得られる領域をスキャンして有望な材料を絞り込み、その記述子パターンを大規模データベースや生成設計ツール内の候補結晶構造に結びつけることができます。
将来の材料研究への意味
一般読者への主要なメッセージは、この研究が材料探索における「グラスボックス」的な人工知能に我々を近づけるという点です。コルモゴロフ–アーノルドネットワークは、最良のブラックボックス予測器にほぼ匹敵する性能を示す一方で、結晶の構造的特徴が熱を電気に変換する能力とどのように結びつくかを数学的な形で示します。速度、精度、可解釈性を兼ね備えたこの組合せは、どの新しい化合物を合成・試験すべきかについて科学者が情報に基づいた選択を行うのに役立ち、生データから実用的な熱電デバイスに到るまでの道のりを短縮する可能性があります。
引用: Fronzi, M., Ford, M.J., Nayal, K.S. et al. Interpretable machine learning for thermoelectric materials design with Kolmogorov–Arnold networks. Sci Rep 16, 14146 (2026). https://doi.org/10.1038/s41598-026-44723-x
キーワード: 熱電材料, 可解釈な機械学習, コルモゴロフ–アーノルドネットワーク, 材料設計, ゼーベック係数