Clear Sky Science · zh
考虑对称性的贝叶斯流网络用于晶体生成
为何更智能的晶体设计至关重要
从电池和太阳能电池到计算机芯片,许多技术依赖于原子按照精确模式排列的晶体。通过试错找到具有有用性质的新晶体材料既缓慢又昂贵。本文介绍了一种新的人工智能方法,能够比以往工具更快地构想出现实的晶体结构,同时遵循真实晶体所具有的复杂对称性模式。该方法可帮助科学家更高效地探索庞大的可能材料空间,并提出针对特定任务量身定制的候选材料。

教模型遵循晶体模式
真实晶体不是随机堆积的原子;它们遵循严格的对称性规则,称为空间群,描述了图案在三维中如何重复和旋转。许多早期的晶体生成 AI 模型忽视了这些规则,常常生成低对称性、在自然中罕见的不现实结构。作者基于一种称为贝叶斯流网络(BFN)的新型生成模型进行扩展,BFN 通过小而受引导的步骤创建数据,并将其适配用于处理晶体结构。他们的方法称为 SymmBFN,采用了考虑对称性的晶体描述,仅关注结构中最小的独特块和重建完整晶体所需的对称操作。这降低了问题的复杂性,并有助于模型忠实再现实验数据库中观察到的空间群分布。
同时处理多种信息类型
设计晶体意味着同时决定多个方面:包含哪些元素、最小重复单元中有多少原子、它们如何定位,以及重复空间的晶胞如何成形。这些既有连续量(如位置和晶格长度),也有离散选择(如元素类型和对称性标签)。SymmBFN 在单一数学框架内处理所有这些不同类型的变量。它直接作用于概率分布的参数,而不是像扩散模型那样通过缓慢地去噪来清理样本。通过在一个经过精心选择的参考系中工作,该参考系已将全局旋转和周期性平移分离出来,该方法自然而然地遵守空间的基本对称性,无需额外机制。

生成晶体的速度与真实度
作者在若干标准晶体数据集上测试了 SymmBFN,包括广泛使用的材料项目(Materials Project)子集以及包含更大晶胞的更具挑战性的集合。他们将其输出与领先的扩散模型和基于流的模型进行比较,使用评估生成晶体在密度、成分和空间群分布上与真实材料匹配程度的指标。一个关键度量侧重于那些稳定、独特且并非简单重复训练样本的结构。SymmBFN 在这些质量指标上达到或优于竞争对手的得分,同时所需的生成步骤仅为许多扩散模型的十分之一。在实际应用中,它生成稳定、新颖晶体的速度可快一个数量级以上,而对于更大、更复杂的结构,这一速度优势会更为显著。
为目标性质设计材料
除了生成真实的晶体外,SymmBFN 还可以被引导生成具有特定物理特性的结构。作者展示了通过向模型输入期望值(例如每原子的形成能或电子能隙),模型能够在生成过程中偏向于具有相应行为的晶体。他们对训练数据中既常见又罕见区域的目标值进行了测试。即便要求具有异常低形成能或不常见能隙的结构,模型也经常产生在请求的性质值附近聚集的稳定或亚稳态候选体。这表明该方法可以作为探索与实际需求对齐的有前景材料空间区域的方向盘。
这对未来材料发现意味着什么
简而言之,SymmBFN 是一个快速且考虑对称性的晶体材料创意生成器。通过遵守真实晶体的几何规则并有效处理多种原子信息,它能够迅速提出现实、多样且可针对性质的结构。尽管实验室中的实际合成仍是最终检验,但该方法降低了数字探索的成本,使得将实验工作集中在最有前景的候选者上变得更容易。随着该方法扩展到多种性质并与实验工作更紧密结合,它可能成为寻找下一代能源、电子等领域关键材料的核心工具。
引用: Ruple, L., Torresi, L., Schopmans, H. et al. Symmetry-aware Bayesian flow networks for crystal generation. npj Comput Mater 12, 182 (2026). https://doi.org/10.1038/s41524-026-02140-8
关键词: 晶体生成, 材料发现, 贝叶斯流网络, 考虑对称性的人工智能, 基于性质的设计