Clear Sky Science · zh

用于材料科学的多模态大型语言模型

· 返回目录

新材料为何与日常生活息息相关

从更好的手机电池到更高效的太阳能电池板以及更快的计算机,许多未来技术都依赖于发现和完善新材料。然而,要确定哪种原子组合会产生恰到好处的性质,就像在宇宙级的大干草堆中寻找针一样困难。本文介绍了MatterChat——一个旨在以日常语言与科学家交流,同时还能“看见”材料的详细原子结构的人工智能系统,帮助预测材料的行为并推断其在实验室中如何制备。

Figure 1
Figure 1.

既能看见原子又能读懂文字的数字助理

MatterChat旨在将两类截然不同的信息结合起来:固体中精确的三维原子排列,以及科学家使用的基于文本的问题和知识。一方面,系统接收晶体结构,这可以表示为原子和键的网络。它将这些结构输入强大的物理启发模型,这些模型在数十万已知材料上训练过,以生成每个原子及其周围环境的紧凑数值指纹。另一方面,一个基于开源Mistral 7B 系统的大型语言模型会将用户的问题(例如关于稳定性或电子行为的询问)转换为其内部表示。一个专门设计的“桥”模块学习如何对齐这两种表征,使语言模型能够直接推理原子在做什么。

用丰富的材料目录来教会系统

为训练MatterChat,作者利用了Materials Project中包含的142,899种无机材料的大型数据库。对于每种材料,他们不仅使用了完整的原子结构,还使用了十二类描述性信息。这些信息从化学式、对称性类型和晶体族等基本标识符,到是否为金属或绝缘体、电子带隙、磁性行为以及若干热力学稳定性度量等九个关键性质。通过将每个结构与关于这些性质的多种文本式问答配对,系统学会将原子排列中的模式与科学家用来描述和分析材料的语言联系起来。

从简单检索到科学式推理

训练完成后,MatterChat能做的不仅仅是重复数据库条目。当用户提供了一个结构后,系统可以回答各种问题,例如识别化学式、判断该材料是否有望在实验室中存在,或估算通常需要繁重量子力学计算的能量。作者展示了MatterChat对特定材料给出详细评估的示例,包括关于稳定性、电子能隙和磁性的评论。在某些情况下,它还能更进一步,生成看起来合理的逐步实验室合成流程,用于制备诸如氮化镓和镧铁石榴石(译者注:原文为yttrium iron garnet,即钇铁石榴石)等知名化合物,这既借助了其语言模型中存储的一般科学知识,又将答案基于所提供的晶体结构。

Figure 2
Figure 2.

在精确数值预测上超过通用聊天机器人

一个显著结果是,MatterChat在预测定量材料性质方面优于传统语言模型及若干专门的基于物理的机器学习工具。在九项基准任务中,它在判断固体是否为金属、是否稳定或是否具有磁性等方面更准确。对于形成能或带隙等连续量,其预测更接近耗费大量计算的模拟所得数值。即便在一组来自GNoME项目且未用于训练的新发现化合物上测试,这一结论依然成立。作者还分析了系统的内部表征,显示相似结构会聚类在一起,稳定性的变化在该内部映射上平滑跟踪,表明模型已学到具有化学意义的模式。

这对新材料发现意味着什么

对于非专业读者,主要结论是MatterChat像一个既懂科学语言又对固体中原子排列有详尽感觉的对话伙伴。通过融合这些能力,它可以快速回答曾经需要专家直觉和昂贵计算才能解决的问题,并能为有前景的候选材料提出现实的合成路线。尽管作者指出该系统在处理极为精确的数值时仍存在困难且有时会过于自信地猜测,但他们认为其模块化设计和强劲性能标志着朝着能帮助科学家在广阔的材料空间中导航、加速从想法到可用技术转变的重要一步。

引用: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

关键词: 材料发现, 多模态人工智能, 晶体结构, 性质预测, 科学聊天机器人