Clear Sky Science · zh
TRACER:以可靠性为先的 GemNet 基线,用于可信的计算材料发现
为何更智能的材料搜索至关重要
新型电池、太阳能电池和电子器件都依赖于找到具有恰当原子配方的材料。计算机可以帮助探索这片庞大的“材料基因组”,但最可靠的物理计算代价极高,无法对数十亿候选项逐一运行。本研究提出 TRACER,一种利用现代机器学习加速搜索的方法,同时严格把控每个预测的可信度,让科学家知道何时可以依赖模型、何时需要用更重的计算来复核。
教会模型解读原子蓝图
这项工作的核心是一类将晶体视为图的神经网络:原子作为节点,节点之间的连接表达三维空间中相互接近的原子。作者基于一种称为 GemNet 的设计,沿这些连接传递信息以学习原子排列如何决定能量——一个判断材料稳定性的基本量。通过在公开数据库中数万种晶体结构上训练,他们的模型学会高精度地预测每个原子的能量,其结果比广泛使用的早期网络 ALIGNN 更接近物理学的金标准,同时训练速度也快数倍。

从平均准确率到可依赖的决策
在实际的筛选活动中,挑战不仅在于平均误差有多小,而在于模型对罕见材料静默失败的频率。TRACER 将关注点从原始准确性转向可靠性。作者运行多个相同的 GemNet 模型副本,每个副本以不同的随机初始化开始,将它们预测之间的分散视为不确定性的度量。当所有副本一致时,置信度高;当它们意见不一时,该预测被标记为有风险。这种简单的集合策略将不确定性转化为可用信号,与实际误差高度相关,能帮助排序哪些候选项可以放心信任,哪些需要额外审查。
找出问题区
利用这一不确定性信号,团队检查了模型表现薄弱的地方。误差往往在原子数非常少或非常多、能量极高或极低、或具有特殊化学组成(如氧簇、金属二聚体和大型碳笼)时更大。关键是,这些案例在集合成员间也表现出高度分歧,因此会被自然标记以供复核。当作者模拟一个现实情形——只有部分预测可用昂贵计算检查时——按模型不确定性优先级排序比随机抽查始终能找到更多这些困难案例。换句话说,该系统不仅知道许多答案,而且常常知道自己不知道哪些答案。

学会什么无济于事
研究还报告了“负面结果”,这些结果虽少被强调,但对未来工作具有指导意义。作者测试了一种策略:在不确定性信号之外增加简单的化学标志,例如材料是否含有过渡金属。更复杂的规则反而表现更差:它常常将常见但容易处理的材料误判为高风险,从而稀释了对真正问题案例的关注。他们还尝试了一个用于适应不同数据域的额外模块,发现对于该单一数据库任务而言,它增加了计算成本但没有带来显著收益。
扩展到新材料家族
为检验所学表示的可重用性,团队将模型应用于另一组钙钛矿材料(对太阳能电池很重要)。在没有任何调整的情况下,预测效果较差,表明该新集合与原始训练数据存在差异。然而,在对新样本进行短时间微调后,相同的 GemNet 主干迅速达到很高的准确度。这表明网络已捕捉到可适配到新化学体系的一般键合和结构模式,仅需适度的额外训练即可移植。
这对未来材料发现意味着什么
综合来看,TRACER 与其说是一个全新模型,不如说是一整套用于诚实、可复现材料筛选的完整方法。它将高效、准确的预测器与经验证的置信度评估方式配对,提供清晰的失败记录和可供他人复现的检查清单。对研究者而言,这意味着他们可以用机器学习扫描大规模材料空间,同时将昂贵的物理计算保留给那些既有趣又不确定的少数案例。这种速度与自知之明的结合,是迈向可信计算发现未来材料(并推动未来技术)的关键一步。
引用: Datta, G., Sharif, S. & Banad, Y. TRACER: a reliability-first GemNet baseline for trustworthy computational materials discovery. Sci Rep 16, 14962 (2026). https://doi.org/10.1038/s41598-026-45279-6
关键词: 计算材料发现, 图神经网络, 不确定性量化, 形成能预测, 材料筛选