Clear Sky Science · zh
用语言模型为量子实验进行元设计
教会机器设计量子实验
量子技术承诺提供超安全的通信、强大的新型计算机和极其精确的传感器,但把量子物理的数学变成实际的实验室装置极其困难。本文展示了如何让一个人工智能语言模型学会编写短小的计算机代码,进而生成整套量子实验的族群。AI 不再只给科学家一个巧妙的设计,而是发现可供人类阅读、重用和改进的一般规则。
从一次性技巧到通用规则
如今,人工智能已被用于搜索能产生特定奇异光态或物质态的量子实验。这些工具往往能超越人类直觉,但通常仅输出单一解答:为某一具体目标给出一个详细的搭建方案。理解该方案为何奏效或如何放大应用则留给研究者,且常常几乎不可能。作者认为,科学家真正需要的不是孤立的配方,而是可复用的设计原则——更像一本食谱,而非一句窍门。

一个新思想:元设计
团队提出了他们所谓的“元设计”。他们不是让计算机设计单一实验,而是让基于 Transformer 的语言模型写出 Python 代码,这些代码本身能生成许多实验。一个典型例子是名为 construct_setup(N) 的函数。对于任意选择的规模 N,该函数都会输出应当产生相应量子态的完整实验蓝图。在量子光学中,研究者操纵单个光子,这意味着代码要决定如何连接光子对源、分束器和探测器,以在粒子数增长时产生高度纠缠的态。
在合成量子世界中训练
为了教会模型这项技能,作者利用了一个有利的不对称性。给出实验装置的描述,计算机相对容易算出会得到哪种量子态;反过来——找到能产生期望态的装置——要困难得多。因此研究者随机生成了数百万个短 Python 程序,在几个小规模(N = 0、1、2)下运行它们,并计算所得的三种量子态。每个训练样例将“这三个示例态”与“产生它们的代码”配对。语言模型学会把这三种态看作一种模式,并预测出在 N 增大时仍然有效的底层代码。
发现与重新发现量子模式
训练完成后,模型在物理学家关心的 20 类量子态族上进行了测试,其中许多来自早期的自动化量子实验设计工作。对于每一类,模型只看到前三个态并被要求生成候选程序。得到的代码被执行并检验其与目标态的匹配程度,不仅针对已见的规模,也针对更大的规模。在 20 个案例中有 6 个,AI 生成的程序完全正确并随体系规模增长继续有效,其中包括两类此前没有已知通用构造。一类与自旋体系相关,受到 Rydberg 原子实验启发,呈现出相邻“自旋向上”粒子从不并列的特性;另一类重现了凝聚态物理著名的 Majumdar–Ghosh 模型的基态。模型还成功地重新发现了 GHZ 态和贝尔态等著名态的已知构造。

超越光子:电路与图态
作者还展示了相同的元设计策略适用于光学实验之外的场景。他们训练了类似的模型来编写量子电路代码——在量子比特上作用的一系列标准门——以在量子计算机上生成目标态。他们也用它来生成构建图态的简单规则,图态中量子比特按线、环或星状排列,作为仅基于测量的量子计算的一类资源。在这两种情况下,AI 都生成了短小可读的程序,能从小系统正确扩展到更大系统。
这对科学为何重要
对非专业读者而言,关键信息是这种方法将 AI 从仅提出答案的黑箱,转变为揭示底层科学结构的工具。通过编写可供人类阅读并能泛化的代码,语言模型揭示了量子态族与实验中的模式,研究者可以检查、验证并改造这些模式。这不仅大幅降低了为越做越大的实验逐一设计所需的惊人计算成本,也为将语言模型作为科学发现伙伴打开了路径——从新型显微镜方案到先进材料——在许多领域中我们真正寻求的是隐藏在复杂现象中的简单规则。
引用: Arlt, S., Duan, H., Li, F. et al. Meta-designing quantum experiments with language models. Nat Mach Intell 8, 148–157 (2026). https://doi.org/10.1038/s42256-025-01153-0
关键词: 量子实验设计, 语言模型, 光子量子态, 程序综合, 科学发现