Clear Sky Science · zh

将物质相连接到模拟变分量子算法中损失景观的平坦性

· 返回目录

为何这对未来量子计算机重要

随着量子计算机从实验室的好奇心走向实用工具,一个主要挑战浮现:随着器件规模增大,许多有前景的算法变得无法训练。本文通过借鉴凝聚态物理的思路,探讨了一种出人意料的解决方法。作者展示了量子物质的不同“相”——多粒子系统自组织的不同方式——如何使变分量子算法要么可训练,要么陷入停滞,并提出了一种在模拟量子硬件上保持可训练性的策略。

与硬件协同工作的量子学习

变分量子算法利用量子设备制备可调的量子态,并由经典计算机调整参数,直到某个目标量(例如能量或代价)被最小化。大多数现有设计是“数字化”的:通过长序列的逻辑门来构建态。尽管灵活,但这些电路可能过于表达性,探索了对任务并非必要的巨大量子态空间。在大系统中,这可能导致所谓的荒原平原问题——损失景观几乎完全平坦,梯度随系统规模呈指数消失。作者改为研究一种“模拟”方法:让一条量子自旋链在其自然相互作用下通过一系列突变(quench)演化,这些突变可以直接在被困离子、Rydberg原子和超导电路等平台上实现。通过控制自旋链中的无序程度,他们可以将每次突变置于两种不同物质相之一:热化相或多体定位相,并研究这种选择如何塑造算法的行为。

Figure 1
Figure 1.

两种相,两种截然不同的学习景观

在热化相中,系统表现得像混沌:相互作用和弱无序迅速将信息和纠缠在所有自旋间扩散,驱动链朝向类似于完全随机量子过程产生的态。在多体定位(MBL)相中,强无序阻止这种混合。初始态中的局部结构在很长时间内仍可见,纠缠增长也非常缓慢。作者使用量化的度量来衡量该算法的ansatz在可能量子演化空间中的探索宽度——即其表达能力,并将其与损失景观的平坦程度联系起来。他们发现,如果施加足够多的突变,两种相都会变得最大表达性,但热化相更早进入该状态。随着达到该状态,损失函数的方差以及学习所需的梯度随量子比特数呈指数缩小,表明出现荒原平原。在MBL相中,同样的命运最终也会发生,但需要更多的突变。

将纠缠增长与可训练性联系起来

为什么MBL相会延迟平坦景观的出现?作者将其归因于纠缠的构建方式。在热化区间,每次突变都会在自旋链的各部分之间产生大的纠缠跳跃,系统迅速模拟完全随机态。这种快速的搅乱抹去了损失景观的结构,使梯度极其微小。相比之下,MBL区间以更慢且更局域的方式产生纠缠。数值上,损失方差达到饱和所需的突变次数,与纠缠达到饱和所需的次数紧密对应,两相之间的差距大致随系统规模线性增长。这意味着存在一个较宽的窗口:MBL基础的ansatz已经具有相当表达力但尚未陷入荒原平原,而热化的ansatz在此时已不可训练。

Figure 2
Figure 2.

一种避免过早失败的初始化策略

基于这一洞见,作者提出了用于设置模拟变分算法的实用规则。选择中等数量的突变并将系统初始化在MBL相:在热化相中已经过深且平坦的相同深度,在MBL相中仍然可训练。在优化过程中,控制参数随后可以在需要时远离严格局域化,从而在没有从平坦区域起步的情况下获得更高的表达力。对小但非平凡示例的测试支持这一观点。对于某些与硬件结构高度匹配的问题,浅层的热化设置可以表现良好。但对于更通用的目标,例如寻找Heisenberg链的基态或求解随机Max-Cut实例,在中等深度下基于MBL的初始化在能量精度和解的质量上显著更好,收敛更可靠,陷入差极小值的实例也更少。

这对扩展量子算法意味着什么

这项研究表明,量子相的物理不仅仅是障碍或奇观,而是设计更好量子学习架构的一种工具。通过在初始化时将模拟器件调到多体定位状态,可以在保持后来训练近似复杂态所需的灵活性的同时,延迟荒原平原的出现。作者强调这并非万能灵药:荒原平原和其他问题(例如糟糕的局部极小值)仍可能出现,而且该方法在很大程度上与具体问题无关。尽管如此,它为构建更具可扩展性的模拟变分量子算法提供了具体的、考虑硬件的指导,并指向一个更广泛的研究计划,即利用局域化、时间晶体或拓扑序等概念来塑造未来量子计算机的学习景观。

引用: Srimahajariyapong, K., Thanasilp, S. & Chotibut, T. Connecting phases of matter to the flatness of the loss landscape in analog variational quantum algorithms. Commun Phys 9, 111 (2026). https://doi.org/10.1038/s42005-026-02528-4

关键词: 变分量子算法, 模拟量子模拟, 多体定位, 荒原平原(barren plateaus), 量子机器学习