Clear Sky Science · zh

使用Kolmogorov–Arnold网络进行热电材料设计的可解释机器学习

· 返回目录

将热能转化为有用的电能

每天,大量能量以废热的形式从汽车发动机、工厂,甚至我们的电子设备中流失。热电材料提供了一种将部分废热直接转换为电能的方式,无需机械运动部件或燃料。但要找到高效的此类材料很困难,因为它们的性能取决于若干紧密相关的电子性质。本研究探索了一种新型人工智能,不仅可以预测材料性能,还能解释原因——为设计更好的热电化合物开辟了更清晰的路径。

Figure 1
Figure 1.

为何更好的热电材料难以发现

热电器件依赖于在一侧加热而另一侧冷却时能产生电压的材料。它们的效率由一个称为zT的量描述,该量取决于三个主要因素:载流子对温度的响应强度(塞贝克系数)、载流子移动的容易程度(电导率)以及材料传热的能力(热导率)。改善其中一项常常会损害另一项——例如,使材料的电导率提高往往也会增强其传热性,从而降低效率。传统的量子力学模拟(如密度泛函理论)可以从原子结构预测这些性质,但计算成本极高,无法应用于数百万个候选材料。

黑箱模型与对洞见的需求

机器学习模型近年来成为基于已有模拟和实验快速估算材料性质的强大工具。在这项工作中,作者从由专门的“Crystalformer”编码器生成的丰富晶体结构数值描述出发,该编码器捕捉了原子在晶体中的排列和相互作用。他们首先训练了一个标准多层感知机——一种常见的深度学习模型——来预测两个关键量:塞贝克系数和影响材料易于承载移动载流子的电子带隙。该模型在大约1.5万种化合物的数据集上对这两项任务都达到了很高的精度。然而,像大多数深度网络一样,它表现为黑箱,对哪些结构特征真正重要或它们如何组合以控制热电响应几乎没有指导意义。

一种不同类型的神经网络

论文的核心思想是用Kolmogorov–Arnold网络(简称KAN)替代不透明的神经网络。KAN不是把所有复杂性隐藏在神经元激活中,而是在层与层之间的连接上附加灵活的一维曲线状函数。从数学上讲,这些曲线是对数据自适应的光滑样条,整个模型可以表示为输入描述符的若干简单函数的和。训练后,作者将这些学得的样条拟合为简洁的数学表达式——由熟悉的函数如正弦、余弦和光滑饱和曲线构建。这样,模型就变成了一个明确的符号公式,将结构描述符与带隙和塞贝克系数联系起来,而不是一堆难以解释的参数。尽管KAN的训练计算代价更高,但它们在精度上可与多层感知机以及文献中的若干其他机器学习基线相媲美,在某些情况下甚至更优。

Figure 2
Figure 2.

模型对材料的学习内容

通过检查KAN的内部结构,作者表明在128个结构描述符中只有一部分强烈影响每个性质。他们计算归因得分以识别最重要的描述符,然后剪除弱连接,留下一个稀疏且更易解释的网络,同时仍能保持良好预测能力。利用成对的排名靠前描述符,他们构建了二维图,展示预测的带隙或塞贝克系数如何在描述符空间中变化。这些图揭示了平滑、协同的效应,其中振荡性和饱和性趋势结合在一起,而不是简单的一对一规则。从化学角度看,模型在具有高度定向键合或强相互作用的d、f电子体系中表现最困难,但即便在这些情况下,KAN也比黑箱模型产生更稳定且符合物理常识的预测。例如,它们产生的不合理负带隙和符号错误的塞贝克值更少。

从预测到引导设计

由于KAN输出的是明确的、光滑的公式而不仅仅是数值预测,研究者可以用它来探索改变底层描述符将如何影响热电性能。尽管这些描述符仍是从深度结构编码器导出的抽象量,但它们与原子排列和键合的真实特征相关联。这意味着研究人员可以将解析性的KAN模型当作一张地图:通过在模型中扫描与高塞贝克系数和合适带隙相关的区域,缩小有前景的材料范围,然后把这些描述符模式对应回大型数据库或生成性设计工具中的候选晶体结构。

对未来材料的意义

对非专业读者而言,关键结论是这项工作使我们更接近于用于材料发现的“玻璃箱”人工智能。Kolmogorov–Arnold网络的表现接近于最佳黑箱预测器,但它们还以数学形式阐明了晶体的结构特征如何与其将热能转化为电能的能力相关联。速度、精度与可解释性的这种组合可以帮助科学家做出更明智的决定,选择哪些新化合物合成和测试,可能缩短从原始数据到能收集废热并提高能效的实际热电器件的路径。

引用: Fronzi, M., Ford, M.J., Nayal, K.S. et al. Interpretable machine learning for thermoelectric materials design with Kolmogorov–Arnold networks. Sci Rep 16, 14146 (2026). https://doi.org/10.1038/s41598-026-44723-x

关键词: 热电材料, 可解释机器学习, Kolmogorov–Arnold网络, 材料设计, 塞贝克系数