Clear Sky Science · zh
深度学习推动在 Au(111) 表面四溴卟啉上实现单键选择性的自主分子反应
教机器逐键调整分子
化学家长期以来一直梦想能像钟表匠那样精确操纵反应,按需在单个分子上改变恰好一根化学键。这项研究展示了人工智能如何朝这一目标迈出重要一步:一个由计算机控制的系统能在表面上找到单个目标分子并自主断开选定的化学键,无需人工直接操作旋钮。这种控制最终可能让我们按原子“书写”新材料,并探索常规试管化学难以到达的奇特分子结构。
为何单键如此重要
大多数化学反应发生在宏观体系中:无数分子碰撞并根据热力学与动力学的普遍规则重排。虽然这种方式对许多应用足够有效,但就像用锤子雕刻大理石而不是用精细的凿子。如果科学家能在单个分子的单一化学键上做出是否断裂的决定,就能为下一代电子器件、量子器件和超高密度数据存储构建定制的分子图案。扫描隧道显微镜(STM)已能让专家以原子分辨率成像并探动金属表面上的单个分子。但迄今为止,执行这些反应依赖于人的直觉和耐心,限制了过程的可重复性、可扩展性和可编程性。

把显微镜变成自动驾驶实验室
作者通过在仪器上叠加多种深度学习工具,把传统 STM 改造为一种自动驾驶的化学实验室。首先,一个计算机视觉模块扫描大面积金表面以自动识别孤立的目标分子,然后放大获得特写视图。额外的神经网络描绘每个分子的轮廓、确定其取向,并检查四个位于角落的溴原子位置。通过分析这些角落的小图像补丁,系统判定每个溴原子是仍然结合还是在先前步骤中已被移除,从而在没有人工解读图像的情况下,有效跟踪分子的“逐键”状态。
会学习断键的 AI 代理
一旦识别出分子并获知其当前状态,强化学习代理便选择行动方案。它将每次尝试断键视为复杂博弈中的一步——STM 探针的位置、电压和电流是它的操作,而分子的变化则是反馈。系统将四个键的状态编码为简单的四位模式,并加入表示所要遵循的整体路径的代码。基于一种称为软行动者-评论家(soft actor-critic)的现代算法,代理逐步学会哪些探针定位和电脉冲组合能干净地断开单个碳—溴键,哪些组合不会产生反应,以及哪些会损伤或过度反应分子。存在一组狭窄的安全且有效的参数窗口,训练早期大多数尝试都会失败,但通过重放和增强经验,并利用分子的四重对称性,代理最终收敛到可靠策略。
为多步分子旅程编程
经过约一天半、数百次反应尝试的连续训练后,系统能够执行预设的多步反应路线并取得显著成功。测试分子是一种铺在金表面上的四溴卟啉,起始时具有四个等价的含溴侧臂。AI 被指示遵循不同的逐步去溴模式——例如“正交”或“之字形”序列——每种路径在结束为完全去溴的分子和表面上四个游离溴原子之前,会经过不同的中间构型。对于每一步,代理自动选择探针放置位置、施加多强的电压脉冲以及使用多少电流,用视觉系统检查结果,然后决定下一步动作。随着时间推移,代理发现随着更多溴被移除需要更高电压,并且将探针精确定位在目标键正上方会将成功概率最大化。

从单次事件走向未来的逐原子制造
研究团队最终展示了其平台能够在维持单键选择性的同时,多次引导分子沿四条不同的反应路径前进,成功率逐步提高,在最后一步断键阶段几乎达到 80%。同样重要的是,系统在显微探针形状或行为发生变化时能快速调整,重新学习最佳设置而非停滞。对于外行人来说,关键信息是显微镜不再只是被动的观察者,而成为主动的、会学习的工具:它能找到分子、决定要断哪根键、施加适当的刺激并自行验证结果。这种精密仪器与 AI 控制的融合指向一个未来——科学家可以编程执行复杂、原子级精度的制造任务,借助软件代理构建和探索用手工几乎不可能制造的定制分子结构。
引用: Zhu, Z., Huang, Q., Yang, T. et al. Deep learning drives autonomous molecular reactions with single-bond selectivity in tetra-brominated porphyrins on Au(111). Nat Commun 17, 2348 (2026). https://doi.org/10.1038/s41467-026-69080-1
关键词: 自主化学, 单分子反应, 扫描隧道显微镜, 深度强化学习, 表面合成