Clear Sky Science · zh

通过深度学习偏置偏斜分布来探索化学与催化

· 返回目录

为什么这项新的化学工具很重要

化学家不仅想知道反应如何进行,还想了解在真实条件下——在溶剂中、催化表面上、工作温度下——分子相遇时哪些反应是可能的。传统上,绘制出原子可重排的所有路径需要费时的猜测和大量计算。本文介绍了一种新的基于计算的方法,称为Loxodynamics,它结合统计学和深度学习的思想,能够自动将分子模拟推动到最可能的反应路径上,而无需提前有人为直觉来判断会形成哪些产物。

Figure 1
Figure 1.

走出能量谷的路径

问题的核心在于分子如何在充满山谷与山峰的复杂能量景观上运动。山谷代表稳定态;越过山峰则对应穿过反应势垒。现实温度下的标准分子模拟常常被困在某个山谷中,无法观测到那些定义化学反应的罕见越垒事件。Loxodynamics 的做法是观察系统在山谷内的徘徊,并提出一个简单的统计问题:局部位置云团在某个方向上是否稍微拉长或“偏斜”得比其他方向多?这种微小的不对称揭示了附近势垒最低的方向,以及系统最可能逃离的方向。

把不对称变成方向盘

该方法以一次短暂的无偏模拟开始,在此过程中收集大量原子位置快照并将其转换为数值描述符,例如键长。因为真实的化学体系涉及许多此类描述符,作者构建了一个特殊的神经网络,称为 Skewencoder。该网络将高维数据压缩为单一坐标,捕捉系统的关键缓慢运动。关键在于,Skewencoder 不仅被训练以重建输入数据,还被优化以最大化沿该新坐标的偏斜度——一种不对称性度量。一旦识别出这一偏斜方向,Loxodynamics 就加入一个温和的单向谐性“墙”,将系统沿分布长尾所在的方向进一步推送,有效地将其引导向最低的邻近势垒之上。

无需化学猜测的迭代搜索

Loxodynamics 以“采样与搜索”循环进行。每次有偏模拟结束后,新轨迹会被加入到用于细化神经网络的全局数据集中,而最新段则用于更新基于偏斜度的引导。随后根据新的偏斜分布重新定位偏置墙,并再次推动系统。这个迭代过程逐步将系统从初始山谷引导到对应中间态或产物的新亚稳态。因为引导坐标和方向是从数据中在线学习得到的,该方法不要求用户事先指定哪些键会断裂或形成,也不要求预先设定会得到哪些产物。

Figure 2
Figure 2.

从简单模型到实际催化的测试

为了展示其能力,作者先将 Loxodynamics 应用于简单的一维和二维模型景观,其中两条不同路径将相同的起始态与终态连接起来。该方法可靠地选出能垒较低的路径。随后他们将方法应用于真实的气相反应:一个经典取代反应(SN2)和一个狄尔斯–阿尔德环加成反应。即便仅提供一般的距离描述符,Loxodynamics 也能自动找到正反两向的正确反应路径,应对宽广、柔软的反应物区和狭窄的产物井。最后,该方法在苛刻的催化情形中接受测试:酸性沸石框架内的乙醇与1-丁醇脱水。在现实操作温度下,该方法发现了已知的“协同”(concerted)和“逐步”(stepwise)机制,识别出短寿命中间体,并区分出不同的烯烃产物——所有这些仅使用简单的基于距离的描述符并且人工干预最小。

这对未来反应发现意味着什么

这项工作表明,一个相对简单的想法——利用局部运动的偏斜性来指示最容易的逃逸路径——可以被转化为实际的分子模拟引导工具。通过将有偏动力学与一个考虑偏斜度的神经网络结合,Loxodynamics 提供了一种系统化的方式来在有限温度下发现可能的反应通道与中间体,而无需人为升高温度或预先定义详尽的反应坐标。从长远看,这类方法可能加速催化剂设计、改进在难以采样的过渡区域的机器学习原子间势,并能扩展到非化学问题,如蛋白折叠或晶体成核——凡是系统需要在复杂能量景观中找到罕见出路的情形均适用。

引用: Zhang, Z., Piccini, G. Exploring chemistry and catalysis by biasing skewed distributions via deep learning. Nat Commun 17, 3010 (2026). https://doi.org/10.1038/s41467-026-69586-8

关键词: 反应发现, 分子动力学, 催化, 深度学习, 自由能景观