Clear Sky Science · zh

基于深度高斯过程的成本感知批量贝叶斯优化,用于复杂材料设计项目

· 返回目录

更聪明的搜索以获得更优材料

设计新金属和合金有点像在巨大的干草堆中寻找少数珍贵的针。每一种候选配方在实验室或超级计算机上测试都可能代价高昂,因此科学家需要方法决定接下来值得探索的少数几项。本论文提出了一种策略,将材料发现视为一个谨慎的提问游戏:它不仅决定接下来要询问哪个合金,还决定运行哪种测试以及该测试将花费多少。目标是在更少且更便宜的测量下更快地获得高性能材料。

搜索为何如此困难

现代合金,尤其是将多种元素以近乎等量混合的高熵合金,存在巨大的设计空间。每种成分组合可能具有许多重要性能,如强度、熔点和热导率,这些性能常常相互权衡。对每一种可能的配方测量或模拟所有这些性能是不可能的。传统的贝叶斯优化方法通过训练统计“替代模型”来从有限样本预测性能并建议下一步实验,已经提供了帮助。但当关系高度纠结、不同性能紧密相关或每个样品只测量到部分性能时,标准替代模型会遇到困难。

学习隐藏结构的分层模型

为了解决这一点,作者基于深度高斯过程构建模型,这是一类分层的概率模型。与单一平滑函数不同,他们堆叠了若干层来逐步变换输入。早期层学习合金成分的隐藏表示;后期层将这些隐藏特征同时映射到多个性能上。这种层次结构自然捕捉到例如设计空间中对成分敏感性随位置变化以及性能之间复杂联系等效应。关键是,该模型还能跟踪自身的不确定性,这在决定是否值得为另一次测量付费时至关重要。由于不同性能可以针对不同合金被观测,模型仍能从部分的、“参差不齐”的数据中受益并在任务间共享信息。

Figure 1
Figure 1.

让每次测量更有价值

第二个关键要素是成本意识。并非所有测量都相同:有些测量(如详细的热导率或熔点测试)代价昂贵;而另一些(如密度或硬度)则更便宜。作者扩展了一种通常只关注科学收益的流行决策规则——即一批新实验可能如何改善已知的性能折衷关系。他们的版本将该收益除以所提议批次的总成本。这促使优化器偏向许多廉价且信息量大的查询,同时将昂贵测量保留给最有前途的候选。作者还混合了“同质”批次(所有性能一起测量)与“异质”步骤(选择性只测量较便宜的性能),利用这些结果在投入高成本测试前对模型进行细化。

在玩具问题和真实合金上的测试

团队首先在具有不同形状和难度级别的标准多目标测试问题上对其方法的数个变体进行了基准测试。他们比较了简单的单任务模型、在性能间共享信息的多任务模型、纯深度模型以及将深度均值预测与多任务不确定性估计相结合的混合模型。结果表明,没有单一方法在所有情形下都占优。简单、浅层模型在低维、曲率较缓的地形上表现出色。多任务模型在高维空间且不同目标紧密相关时表现突出。深度和混合模型则在高度扭曲、非凸的地形上显示出优势,在这些情况下捕捉复杂结构和偏态分布尤为重要。

更快找到高性能合金的路径

为展示实际影响,作者随后对用于高温环境的耐火高熵合金进行了完全模拟的发现活动。他们探索了一个七元素的成分空间,尝试同时最大化五项关键性能,同时将另外两项性能作为有用的辅助信息。成本分配遵循现实情形——热导率和液相线温度被设定得比密度、硬度或延展性指标昂贵得多。新框架能够引导采样朝向在多个性能目标间取得平衡的成分空间区域,同时大量重复利用廉价测量并谨慎调用高成本测量。随着数据积累,深度且成本感知的策略匹配或略微超过了传统方法的性能,并且在固定评估预算下更聪明地使用资源。

Figure 2
Figure 2.

这对材料发现意味着什么

对于非专业读者,主要信息是这项工作提供了一种原则性方法,在寻找新材料时更明智地“花费”实验和计算资源。通过将学习隐藏模式的分层概率模型与将预期科学收益与测试成本权衡的预算策略相结合,该方法可以在更少且更有选择性的步骤中达到高性能的合金设计。尽管在复杂且噪声大的问题上优势最为显著,该框架为未来需要同时兼顾大量变量、多重目标和紧张资源限制的研究活动奠定了重要基础。

引用: Alvi, S.M.A.A., Vela, B., Attari, V. et al. Deep Gaussian process-based cost-aware batch Bayesian optimization for complex materials design campaigns. npj Comput Mater 12, 105 (2026). https://doi.org/10.1038/s41524-026-01981-7

关键词: 材料发现, 贝叶斯优化, 深度高斯过程, 高熵合金, 成本感知设计