Clear Sky Science · zh
POLYT5:一种用于生成聚合物设计的编码器—解码器基础化学语言模型
教会计算机“塑料”的语言
塑料和其他聚合物无处不在——从手机壳和电源线到电动汽车电池。然而,要发现具有恰当强度、柔韧性和电性组合的新聚合物,过程既缓慢又昂贵。本文介绍了 POLYT5,一种让人工智能学习聚合物“语言”的系统,既能预测聚合物性能,又能构思有前景的新材料,从而帮助科学家快速设计用于先进电子和能量储存的材料。

为何新聚合物难以发现
设计新聚合物就像在一个包含所有可能字母组合的图书馆中寻找一条有用的句子。化学家可以调整构件并测试结果,但可能性数量天文般巨大。传统机器学习通过预测已知聚合物的性质提供了帮助,然而这些工具通常依赖手工设计的数值描述符,仍然需要人为猜测哪些候选结构值得测试。通用大型语言模型可以生成分子,但它们常常缺乏进行可靠材料设计所需的化学“常识”,会产出在纸面上看似合法但在实验室中不现实或难以合成的配方。
赋予人工智能以聚合物聚焦的词汇
POLYT5 通过在聚合物结构上进行专门训练来应对这一挑战,而不是在通用文本上训练。作者组装了一个庞大的训练集:来自文献的超过 12,000 个真实聚合物,以及用化学家常用的成熟反应生成的超过 1 亿个假想聚合物。为了将这些结构输入语言模型,他们将每个聚合物转换为一种健壮的字符串表示,保证化学上有效。特殊标记标示重复单元的端点并编码简单的性质信息。借助 T5 编码器—解码器架构,POLYT5 学会重建被掩盖的字符串片段,逐步内化反复出现的模式——例如常见的主链和官能团——以及这些模式与材料行为之间的关系。
从“阅读”聚合物到预测其行为
在这种大规模训练之后,POLYT5 被微调以执行实际任务。一组模型用于预测关键聚合物性质:玻璃化转变温度(塑料软化的温度)、熔点和分解温度、电子能隙、介电常数(储存电能的能力),以及聚合物在各种溶剂中的溶解性。在数千个示例上,模型的预测与已知值高度一致,误差与或优于以往的机器学习方法。重要的是,POLYT5 能用相同的底层表示处理多种不同性质,减少了对定制特征或为每个任务构建独立工具的需求。

让模型去发明新材料
相同的框架也可以反向运行:POLYT5 不仅能对给定聚合物预测性质,还能生成符合期望性质的聚合物结构。作者将重点放在玻璃化转变温度上,因为它对器件的机械和热稳定性至关重要。通过给模型一个目标值——例如 500 开尔文——他们要求模型生成应在该温度附近软化的假想聚合物的字符串表示。团队探索了采样设置如何影响多样性与合法性之间的平衡,最终生成了超过六百万个独特且在化学上合理的候选体,这些候选在所选温度附近集中,同时在结构上与已知聚合物保持区别。
从数百万中寻找少数瑰宝
为展示实际影响,研究者将 POLYT5 用于一个具体目标:用于高性能电绝缘体和能量储存器件的聚合物。从数百万个生成候选中,他们使用 POLYT5 自身的性质预测器施加多步数字过滤。聚合物必须具备相对较高的介电常数、足够宽的电子能隙以避免击穿、良好的热稳定性和实用的加工窗口。它们还必须可溶于像水或乙醇这样常见且环保的溶剂,并且应按照标准化学规则看起来可合成。这个筛选漏斗将候选缩小到约 18,000 个有前景的选项。从中,团队选择了一个易于合成的候选。在实验室合成并测量其性能时,实验结果与 POLYT5 的预测相符,落在预期误差范围内。
让先进的聚合物设计更易获取
除了核心模型外,作者还构建了一个“能动”人工智能界面,使用户能够通过自然语言与 POLYT5 交互。通用语言模型会解释诸如“预测该聚合物的介电常数”或“建议具有高熔点且可溶于乙醇的聚合物”之类的问题,然后将这些请求路由到底层相应的 POLYT5 工具。该设置隐藏了化学字符串格式和模型选择的复杂性,使强大的聚合物设计功能对专家和非专家都可用。简而言之,POLYT5 表明,教会人工智能读写“塑料的语言”可以大大加速寻找新型高性能材料的进程,可能缩短从电脑屏幕到可用器件的路径。
引用: Sahu, H., Xiong, W., Savit, A. et al. POLYT5: an encoder-decoder foundation chemical language model for generative polymer design. npj Artif. Intell. 2, 30 (2026). https://doi.org/10.1038/s44387-026-00087-1
关键词: 聚合物设计, 化学语言模型, 材料发现, 介电聚合物, 生成式人工智能