Clear Sky Science · zh

一种由人工智能驱动的光催化合成规划平台(PhotoCat)

· 返回目录

为更聪明的化学照亮前路

化学家越来越多地使用光来驱动化学反应,将简单的起始原料转化为药物、材料和香精,同时减少废物和能源消耗。然而,设计这些由光驱动的光催化反应往往需要通过慢速的试错法来完成。本文介绍了 PhotoCat——一个人工智能平台,它从数以万计的以光为驱动的反应中学习,帮助科学家预测反应结果、规划新合成并选择可行的实验条件。对于读者而言,这是人工智能与绿色化学如何结合以加速发现并降低环境影响的一个窗口。

Figure 1
Figure 1.

构建光驱动反应的地图

作者的第一步是汇集已知光催化化学的详细地图。他们梳理了科学文献和实验记录,建立了 PhotoCatDB——一个收录 26,700 条光驱动反应的人工整理数据库。每条记录不仅记录了参与反应的分子种类和产物,还包含关键的实验细节:所用的光催化剂、是否存在酸、碱或添加剂、溶剂以及光的颜色(波长)。许多记录是多组分反应,即多个构建模块同时反应,反映了实验室中化学家面临的复杂性。通过比较产物之间的相似性,团队确保数据库强调的是多样且新颖的反应,而不是大量近重复条目。

教会 AI 理解光化学

在该数据库之上,研究人员构建了 PhotoCat——一系列基于最初为语言翻译开发的 Transformer 架构的深度学习模型。一个模块 PhotoCat-RXN 学习如何从起始物质及(若可用)反应条件预测产物。另一个模块 PhotoCat-Retro 则反向工作:给定目标分子,它提出可行的光催化起始物和步骤。第三个模块 PhotoCat-Cond 建议实际的实验设置——光催化剂、溶剂、添加剂和光波长——以提高拟议反应成功的可能性。为了给模型提供广泛的“化学常识”,团队先在公共专利数据中的数百万条一般反应上进行训练,再在专门的光催化数据集上微调。

Figure 2
Figure 2.

为何反应条件与试剂同等重要

这项工作的一个关键见解是,向 AI 明确提供反应条件会显著提升其表现。当模型仅接收起始分子信息时,它预测主要产物的准确率已经相当可观。但加入关于光催化剂、酸或碱、添加剂、溶剂和光色的结构化信息后,首选预测的准确率超过了 82%,并加快了训练速度。作者展示了一个生动的例子:强酸的存在与否会使反应从生成酮类转变为生成烯烃。模型的注意力图表明,它在预测由该选择控制的产物结构部分时,会特别关注酸这一标签——这与人类化学家在思考条件时的推理方式相呼应。

从屏幕到实验台:发现新反应

为检验 PhotoCat 是否超越纯数值演练,团队用它提出了全新的光催化转化,并在实验室中进行了验证。工作流程从 PhotoCat-Retro 建议一个通向目标结构的光驱动路线开始,随后 PhotoCat-Cond 选择条件,PhotoCat-RXN 检查预测产物的一致性。在 22 个 AI 建议的候选中,化学家挑选出五个看起来新颖且可行的;其中四个在实验室中以良好产率获得成功。这些新反应包括:一种类似但更清洁的 Friedel–Crafts 酰化的光驱动酰化、无催化剂的苯并恶唑生成路线、一种在空气作为氧化剂的条件下向不饱和酸引入三氟甲基的无金属方法,以及一种对简单烯烃高效触发的光诱导氧胺化反应。

对未来绿色化学的意义

对于非专业读者,结论是 PhotoCat 像一个智能助理,读过数万篇光催化论文,能够建议实验室中“接下来该试什么”。通过将专门构建的数据库与现代 AI 模型结合,该平台达到了与最佳通用反应预测工具相当的准确性,但专门针对光驱动化学进行定制。更重要的是,它将抽象的预测转化为化学家可以检验的可操作配方,缩短了从想法到实验的路径。随着数据库的增长以及模型与更广泛规划工具的连接,类似 PhotoCat 的系统可能会帮助使光催化在化学生产中成为常规的、更环保的选择,从而悄然提升我们日常依赖产品的可持续性。

引用: Xu, J., Zhai, S., Huang, P. et al. An artificial intelligence-driven synthesis planning platform (PhotoCat) for photocatalysis. Commun Chem 9, 92 (2026). https://doi.org/10.1038/s42004-026-01894-y

关键词: 光催化, 人工智能, 反应预测, 逆合成, 绿色化学