Clear Sky Science · zh

QKAN:具有机器学习和多变量态制备应用的量子 Kolmogorov‑Arnold 网络

· 返回目录

用于复杂模式的量子“脑”

当今许多最难的问题——从理解奇异材料到分析高维数据——都涉及普通计算机和神经网络难以捕捉的模式。本文提出了一种新型“量子脑”,称为量子 Kolmogorov‑Arnold 网络(QKAN),旨在在未来的容错量子计算机上运行。QKAN 旨在处理庞大的量子数据集,甚至以比经典方法更高效的方式构建复杂量子态,可能为量子机器学习和量子模拟开辟新途径。

Figure 1
Figure 1.

从经典数学思想到量子架构

该工作建立在称为 Kolmogorov‑Arnold 表示的数学见解之上:原则上,任何多变量的光滑函数都可以由简单的一变量分量和加法组装而成。最近的“Kolmogorov‑Arnold 网络”(KAN)将这一思想改编为一种经典神经网络设计,它将许多简单的一维激活函数连接在一起,而不是主要依赖矩阵乘法。KAN 在那些底层公式具有结构性和可解释性的科学问题中表现出潜力。作者以此概念蓝图为出发点,提出问题:我们能否构造一个以量子电路语言原生存在的纯量子版本?

将量子矩阵变为“神经元”

在 QKAN 中,基本的信息载体不再是普通数值,而是特殊量子矩阵的特征值。这些矩阵通过一种称为区块编码(block‑encoding)的标准技巧被嵌入更大的幺正操作中。一个强大的技术——量子奇异值变换(quantum singular value transformation)——使得电路可以对这些特征值施加定制的多项式函数,有效地担当神经网络中激活函数的角色。通过在一层或少数几层中排列这些操作,QKAN 能同时作用于指数级大的输入空间——当输入本身是量子态时,经典网络在可比资源下无法做到这一点。

宽而浅的量子网络

作者证明 QKAN 自然实现了“宽而浅”的架构。如果一个量子设备可以高效地对 N 维输入进行区块编码——例如由另一个算法制备的量子态或描述物理系统的哈密顿量——那么一层 QKAN 可以用仅对 N 的多对数开销实现极其宽的变换。堆叠多层代价高昂,因为电路深度会随层数大致呈指数增长且微小误差会累积。因此,QKAN 最适合使用少量层,以宽度上的极端并行性换取深度的节省。论文分析了如何用量子电路参数化这些网络、如何用基于梯度的策略训练它们,以及如何高效读出低维输出。

Figure 2
Figure 2.

将量子态制备作为应用场景

除学习任务外,同一构造还可作为制备复杂量子态的工具。作者聚焦于一类重要示例:分布在规则网格点上的多变量高斯分布。他们设计了一个两层 QKAN,第一层通过简单的多项式变换计算每个网格点到原点的平方距离,随后应用精心选择的多项式近似来模拟高斯的指数衰减。当将这种区块编码的变换施加到均匀叠加态并进行放大时,结果是一个振幅近似遵循高维高斯轮廓的量子态。分析给出了所需量子门数和额外量子比特数的明确界限。

量子学习的机遇与局限

对非专业读者而言,关键结论是 QKAN 提供了一种新的、有结构的量子算法语言,将可解释神经网络的思想与先进的量子线性代数工具相结合。原则上,它可以计算量子数据的复杂函数,并以比已知经典方法更少的步骤组装多变量概率景观,前提是存在合适的多项式近似且高效的区块编码可用。与此同时,QKAN 并非一劳永逸的通用方案:其层数必须保持较小,性能依赖于良好的多项式基,并且它继承了经典 KAN 在何种情况下该架构真正优越的未决问题。不过,QKAN 扩展了量子机器学习和态制备的工具箱,指向既强大又结构透明的量子模型。

引用: Ivashkov, P., Huang, PW., Koor, K. et al. QKAN: quantum Kolmogorov-Arnold networks with applications in machine learning and multivariate state preparation. npj Quantum Inf 12, 73 (2026). https://doi.org/10.1038/s41534-026-01202-5

关键词: 量子机器学习, Kolmogorov‑Arnold 网络, 量子神经网络, 量子态制备, 量子奇异值变换