Clear Sky Science · zh

通过全局编码扩展图神经网络的作用范围

2026-02-18 · 返回目录

为什么分子中的远程联系很重要

从新药开发到更高效的电池，许多现代突破依赖于能够预测数千个原子如何相互推拉的计算模型。一类叫做图神经网络的流行 AI 模型已成为这项任务的主力。但这些模型存在盲点：它们主要关注近邻，尽管遥远的原子可以通过电力和量子力强烈相互影响。本文介绍了 RANGE，一种赋予这些神经网络某种全局视角的方法，使它们能够“感知”并预测远程效应，而不会变得极其缓慢或占用过多内存。

当前的 AI 仅能看到邻域

图神经网络将分子或材料视为由节点（原子）和边（它们的关系）构成的网络。在每一步中，每个节点仅通过与固定距离内的近邻通信来更新其状态。重复多次可以慢慢传播信息，但这种策略有两大缺点。首先，信息在经过许多中间节点时会被模糊化，这称为过度平滑。其次，图中的狭窄路径会限制信息流通，导致过度压缩。这两类问题在尝试捕捉作用于数埃以外的力（例如大分子或晶体中的静电和色散力）时变得尤为严重。简单地扩大相互作用距离或堆叠更多层会使模型变得昂贵，同时仍无法彻底解决这些瓶颈。

为全局通信添加虚拟枢纽

RANGE（用于全局编码的中继注意节点）通过添加一小组不对应任何真实原子的虚拟“主节点”来改造这一框架。它们充当全局枢纽。在常规的基于近邻的信息传递步骤之后，使用注意力机制将所有原子的信息汇聚到这些枢纽：每个主节点会学习关注体系的哪些部分。该聚合形成了分子状态的粗粒度摘要。在第二个广播步骤中，这些摘要再通过注意力发送回每个原子，使每个原子在保留自身局部记忆的同时，决定应听取各个主节点多少信息。因为每个原子都直接连接到每个主节点，所以远程通信可以在一步内发生，将图转变为小世界网络，使相距甚远的区域能够快速高效地相互影响。

看到其他方法忽略的远程力

研究人员通过将 RANGE 附加到若干最先进的分子力场模型上并与其原始的纯局部版本比较来测试该方法。他们选用了已知远程效应至关重要的具有挑战性的体系：含有额外钠离子作为掺杂剂的盐晶体、接近掺杂氧化物表面的金二聚体，以及在不同距离下相互作用的一对有机分子。标准模型基本上未能注意到远处电荷重排或隐藏掺杂剂如何改变能量格局；当远程环境发生变化时，它们的预测几乎没有变化。相比之下，RANGE 增强的模型正确捕捉到了不同的能量曲线，并能够外推到训练时未见过的更大间距，对于难处理的带电二聚体，误差最多小了四倍。

在不压垮计算机的前提下提高精度

关键在于，RANGE 在不带来其他全局方法高昂计算成本的情况下，提供了这种改进的视野。借用物理学方法的技术，如 Ewald 求和或基于傅里叶的修正，通常需要约随原子数平方增长的运算或依赖大规模网格，这使它们在大体系和重复模拟中代价高昂。RANGE 则按设计与体系规模线性扩展：每个主节点与所有原子相连，但主节点数量增长温和，并由一种正则化方案控制，防止它们变得冗余。对更大数据集的基准测试表明，即便在基础模型使用较短相互作用截断的情况下，RANGE 也能持续降低预测力的误差，而且仅带来适度的运行时间和内存增加。团队还在复杂分子上运行了数十纳秒的分子动力学模拟，发现基于 RANGE 的力场保持稳定并能探索现实的构型与状态。

对分子世界更清晰的总体视角

对非专业读者而言，关键论点是：RANGE 为现有基于图的 AI 模型提供了一种在保持局部操作的同时进行全局思考的新方式。通过引入智能虚拟枢纽和由注意力驱动的信息流，它克服了阻碍神经网络捕捉分子与材料中远程多体效应的常见瓶颈。这意味着在远距区域相互微妙影响的体系中——从柔性的药物分子到扩展的纳米结构——能够得到更可靠的预测，而无需付出不可承受的计算代价。随着这些方法被应用到越来越大、更复杂的环境中，它们有望使 AI 工具更忠实地反映物理相互作用的真实长程结构。

引用: Caruso, A., Venturin, J., Giambagli, L. et al. Extending the range of graph neural networks with global encodings. Nat Commun 17, 1855 (2026). https://doi.org/10.1038/s41467-026-69715-3

关键词: 图神经网络, 远程相互作用, 分子模拟, 机器学习力场, 注意力机制