Clear Sky Science · zh
在室温及更高温度下展现出前所未有稳健性的物理知情原子能模型
这对日常化学为何重要
计算机模拟是现代化学和材料科学的主力工具。它们让科学家能够在计算机中观察分子如何扭动、振动和碰撞,而不必依赖昂贵且耗时的实验。然而,当这些模拟依赖机器学习时,模拟有时会突然“崩溃”,产生不可能的分子构型——在较高温度下尤为常见。这项研究引入了一种新型的物理知情机器学习模型,能在极长时间尺度上、在高达1000开尔文的温度下运行而不崩溃。

从聪明的捷径到脆弱的模拟
传统量子化学以高精度计算分子能量,但速度很慢。更简单的力场运行快速但常有近似。机器学习势力图将两者优点结合:它们从分子几何到能量和力学习一条捷径,然后用这条捷径驱动分子动力学。从表面上看,许多此类模型在标准测试集上显示出极小的平均误差。但这些数字在实践中可能具有欺骗性。当分子在模拟过程中探索新的构型——尤其是在高温下——许多模型会被推到其训练结构范围之外。它们不是温和地将分子引回现实构型,反而可能预测出会拉伸或压碎键的力,直到整个体系变得不合物理并导致模拟崩溃。
基于量子构件构建模型
作者通过改变模型所学习的内容以及如何由先验物理引导来应对这种脆弱性。他们采用名为FFLUX的框架,该框架建立在相互作用量子原子(IQA)方法之上。在IQA中,分子被划分为“拓扑原子”,这些原子的个体能量直接由量子力学确定。这些原子能具有物理意义,并且相加得到分子的总能量。新提出的高斯过程模型不是学习任意的位点能,而是学习这些源自量子的原子能,为每次预测提供了深厚的物理锚点。四种柔性的有机分子——肽封端的甘氨酸和丝氨酸、丙二醛以及阿司匹林——由于内部运动多且已知对现有机器学习力场具有挑战性,被用作苛刻的测试对象。
教模型预期会出现问题
一个关键创新在于在模型见到数据之前如何设置高斯过程:其“均值函数”编码了模型在欠知区域的先验假设。大多数先前工作简单地将该均值置为零,等于假定模型没有先验期望。作者则有意将该均值向更高的原子能态偏移,同时保持物理上的合理性。这个设计意味着当模型被迫外推时——例如化学键被暂时过度拉伸时——它自然倾向于给出惩罚极端畸变的预测。在大量测试中,仅在此先验上有差异的模型表现迥异。具有传统或低能均值的模型通常在不到皮秒的时间内即因分子爆裂或塌缩而失效。相比之下,表现最佳的高能均值(称为MF5)在300到1000开尔文温度范围内对所有四种分子在整个纳秒测试窗口内均保持稳定。

观察畸变分子自我修复
为探究稳健模型为何如此有效,研究者从刻意损坏的构型开始模拟,这些构型具有严重拉伸或压缩的化学键。对于丝氨酸、阿司匹林和丙二醛,这些起始点的能量比正常构型高出数百到一千多千卡/摩尔——这些构型通常会导致灾难性后果。在较弱的均值函数下,分子很快四散而去。而在MF5设置下,预测出的力立即指向缩短被拉长的键和延长被压扁的键的方向。在几十到几百个时间步内,分子松弛为现实的构型并继续稳定演化。团队还表明,在从未对力进行训练的情况下,同一模型也能用于丙氨酸二肽的几何优化,重现已知的低能构象和相对能量,误差在几十分之一千卡/摩尔内,但计算成本比完整量子计算低约200倍。
在普通硬件上进行长时间高温模拟
稳健性不仅仅是从一次困难起始中幸存;更在于在数百万或数十亿时间步中保持稳定。作者进一步考验了他们的最佳模型:在500开尔文下对四种测试分子分别运行了50个独立模拟,每个模拟时长10纳秒。所有这些运行都没有崩溃,总合模拟时间达到半微秒——这是尖端机器学习力场中少见的即成就。更引人注目的是,这些模拟在标准CPU上高效运行,其逐步速度可与或优于一些需要强力GPU的著名神经网络势相比。整个过程中,分子探索了丰富的构型和亚稳定态,表明稳健性不是通过人为冻结运动或强制刚性结构来换取的。
这对未来分子建模意味着什么
对非专业读者来说,关键信息是:并非所有低误差的机器学习模型在被强力推动时都值得信赖。作者通过将模型建立在量子导出的原子能之上,并将模型内建的期望谨慎地调向高能态,创建了一系列势,这些势自然产生“恢复力”——类似于分子的安全带——在高温和畸变起点下也能保持模拟的物理合理性。这种方法有望实现对复杂分子的更可靠、更长时间的模拟,并指向未来的扩展方向,使类似的物理知情模型能够处理凝聚相和像色散这样微妙的相互作用,同时仍保持计算上的可行性。
引用: Isamura, B.K., Aten, O., Nosratjoo, M. et al. Unprecedented robustness of physics-informed atomic energy models at and beyond room temperature. Commun Chem 9, 138 (2026). https://doi.org/10.1038/s42004-026-01965-0
关键词: 机器学习力场, 分子动力学稳健性, 高斯过程势, 物理知情建模, 量子原子能