Clear Sky Science · zh

将物质相连接到模拟变分量子算法中损失景观的平坦性

2026-02-18 · 返回目录

为何这对未来量子计算机重要

随着量子计算机从实验室的好奇心走向实用工具，一个主要挑战浮现：随着器件规模增大，许多有前景的算法变得无法训练。本文通过借鉴凝聚态物理的思路，探讨了一种出人意料的解决方法。作者展示了量子物质的不同“相”——多粒子系统自组织的不同方式——如何使变分量子算法要么可训练，要么陷入停滞，并提出了一种在模拟量子硬件上保持可训练性的策略。

与硬件协同工作的量子学习

变分量子算法利用量子设备制备可调的量子态，并由经典计算机调整参数，直到某个目标量（例如能量或代价）被最小化。大多数现有设计是“数字化”的：通过长序列的逻辑门来构建态。尽管灵活，但这些电路可能过于表达性，探索了对任务并非必要的巨大量子态空间。在大系统中，这可能导致所谓的荒原平原问题——损失景观几乎完全平坦，梯度随系统规模呈指数消失。作者改为研究一种“模拟”方法：让一条量子自旋链在其自然相互作用下通过一系列突变（quench）演化，这些突变可以直接在被困离子、Rydberg原子和超导电路等平台上实现。通过控制自旋链中的无序程度，他们可以将每次突变置于两种不同物质相之一：热化相或多体定位相，并研究这种选择如何塑造算法的行为。

两种相，两种截然不同的学习景观

在热化相中，系统表现得像混沌：相互作用和弱无序迅速将信息和纠缠在所有自旋间扩散，驱动链朝向类似于完全随机量子过程产生的态。在多体定位（MBL）相中，强无序阻止这种混合。初始态中的局部结构在很长时间内仍可见，纠缠增长也非常缓慢。作者使用量化的度量来衡量该算法的ansatz在可能量子演化空间中的探索宽度——即其表达能力，并将其与损失景观的平坦程度联系起来。他们发现，如果施加足够多的突变，两种相都会变得最大表达性，但热化相更早进入该状态。随着达到该状态，损失函数的方差以及学习所需的梯度随量子比特数呈指数缩小，表明出现荒原平原。在MBL相中，同样的命运最终也会发生，但需要更多的突变。

将纠缠增长与可训练性联系起来

为什么MBL相会延迟平坦景观的出现？作者将其归因于纠缠的构建方式。在热化区间，每次突变都会在自旋链的各部分之间产生大的纠缠跳跃，系统迅速模拟完全随机态。这种快速的搅乱抹去了损失景观的结构，使梯度极其微小。相比之下，MBL区间以更慢且更局域的方式产生纠缠。数值上，损失方差达到饱和所需的突变次数，与纠缠达到饱和所需的次数紧密对应，两相之间的差距大致随系统规模线性增长。这意味着存在一个较宽的窗口：MBL基础的ansatz已经具有相当表达力但尚未陷入荒原平原，而热化的ansatz在此时已不可训练。

一种避免过早失败的初始化策略

基于这一洞见，作者提出了用于设置模拟变分算法的实用规则。选择中等数量的突变并将系统初始化在MBL相：在热化相中已经过深且平坦的相同深度，在MBL相中仍然可训练。在优化过程中，控制参数随后可以在需要时远离严格局域化，从而在没有从平坦区域起步的情况下获得更高的表达力。对小但非平凡示例的测试支持这一观点。对于某些与硬件结构高度匹配的问题，浅层的热化设置可以表现良好。但对于更通用的目标，例如寻找Heisenberg链的基态或求解随机Max-Cut实例，在中等深度下基于MBL的初始化在能量精度和解的质量上显著更好，收敛更可靠，陷入差极小值的实例也更少。

这对扩展量子算法意味着什么

这项研究表明，量子相的物理不仅仅是障碍或奇观，而是设计更好量子学习架构的一种工具。通过在初始化时将模拟器件调到多体定位状态，可以在保持后来训练近似复杂态所需的灵活性的同时，延迟荒原平原的出现。作者强调这并非万能灵药：荒原平原和其他问题（例如糟糕的局部极小值）仍可能出现，而且该方法在很大程度上与具体问题无关。尽管如此，它为构建更具可扩展性的模拟变分量子算法提供了具体的、考虑硬件的指导，并指向一个更广泛的研究计划，即利用局域化、时间晶体或拓扑序等概念来塑造未来量子计算机的学习景观。

引用: Srimahajariyapong, K., Thanasilp, S. & Chotibut, T. Connecting phases of matter to the flatness of the loss landscape in analog variational quantum algorithms. Commun Phys 9, 111 (2026). https://doi.org/10.1038/s42005-026-02528-4

关键词: 变分量子算法, 模拟量子模拟, 多体定位, 荒原平原（barren plateaus）, 量子机器学习