Clear Sky Science · zh

使用副本交换嵌套抽样的第一性原理相图的主动学习势

· 返回目录

这对未来材料意味着什么

从更快的计算芯片到更坚固的飞机部件,许多现代技术都依赖于理解材料在加热或受压时如何变化。这些变化称为相变,通常由相图来概述——这些图像告诉科学家在何种条件下材料以哪种形态稳定。此研究引入了一种新的方法,可以直接从量子力学计算自动绘制此类图谱,利用人工智能大幅降低计算成本,同时保持高精度。

Figure 1
Figure 1.

无须猜测地绘制材料图谱

传统上,从第一性原理构建相图就像在黑暗中徒步穿越崎岖的地形:你必须事先怀疑重要的山谷和山口在哪里。许多标准方法仅在研究人员提供关于要探索哪些晶体结构或“路径”的强先验知识时才有效。作者则依赖一种称为嵌套抽样的技术,它系统地梳理材料的完整能量景观,而无需假设会出现哪些相位。通过跟踪该景观中不同区域的可达性,嵌套抽样能够在一次扫描中恢复热力学性质和随广泛温度范围的相变。

让模型自选需要学习的内容

即便是最聪明的搜索方法也需要对原子间相互作用有良好的描述。直接的量子力学计算(密度泛函理论)虽然准确,但要被评估数百万或数十亿次时代价太高。团队通过训练机器学习的原子间势来解决这一问题——这些是快速模型,用以模拟原子间的量子力学力。问题在于,这类模型只有在见过足够多实例时才可信赖。为此,作者建立了一个主动学习循环:机器学习模型运行嵌套抽样模拟,标记其不确定的构型,然后仅对这部分精心挑选的子集请求高水平的量子计算。新数据被反馈回模型,使其在对相图最重要的区域变得更可靠。

Figure 2
Figure 2.

用于探索硅、锗和钛的新引擎

研究人员在三种重要元素上测试了他们的方法:硅和锗——众所周知的半导体,以及钛——一种广泛使用的结构金属。他们从基于已知晶体结构和简单畸变构建的适度初始数据库开始,有意省略了液相和许多高能构型。副本交换嵌套抽样(在不同压力下进行的多次嵌套抽样运行可以交换构型)随后探索了材料的能量景观。在每一轮探索之后,算法自动选择数百个具有代表性的原子构型,偏重于那些其力预测在一个由神经网络模型组成的委员会中分歧最大的构型。这些构型用高精度量子方法(r2SCAN)重新计算,并用于在启动下一轮之前重新训练势。

从嘈杂的起点到可靠的相图

经过大约十到十五个学习循环,模型的不确定性稳步缩小,特别是在支配原子运动的力方面。与此同时,嵌套抽样轨迹开始揭示出熟悉的相图轮廓。对于硅,该方法再现了已知的低压金刚石结构、其高压六方相以及随温度和压力变化的典型熔化行为,均与实验和早期模拟结果良好一致。锗显示出类似的模式:低压的类金刚石相让位于高压的金属性相,尽管由于所选量子近似不同,确切的转变压力有所偏移。钛则提供了更严苛的考验:其相为金属,相互结构相似且能量差小。即便如此,主动学习策略仍捕捉到了固相序列和熔化线,使用径向分布函数的额外检查也确认了预测结构的身份。

这对设计新材料意味着什么

简而言之,这项研究表明计算机现在可以自学材料在广泛温度和压力范围内的行为,仅在必要时向量子力学的“神谕”询问。副本交换嵌套抽样引擎保证了广泛且无偏的探索,而主动学习循环确保机器学习势在热力学上重要的地方具有足够精度。尽管当前工作聚焦于三种元素和一种特定的量子方法,该框架具有通用性:它可以与更先进的电子理论或更强大的神经网络配合,并扩展到复杂合金或化合物。随着计算能力和算法的进步,这类自主工作流程有望成为预测相图和指导发现具有定制性质的新材料的标准工具。

引用: Unglert, N., Ketter, M. & Madsen, G.K.H. Active learning potentials for first-principles phase diagrams using replica-exchange nested sampling. npj Comput Mater 12, 107 (2026). https://doi.org/10.1038/s41524-026-01989-z

关键词: 材料相图, 主动学习, 机器学习势, 嵌套抽样, 硅 锗 钛