Clear Sky Science · zh

QKAN：具有机器学习和多变量态制备应用的量子 Kolmogorov‑Arnold 网络

2026-03-11 · 返回目录

用于复杂模式的量子“脑”

当今许多最难的问题——从理解奇异材料到分析高维数据——都涉及普通计算机和神经网络难以捕捉的模式。本文提出了一种新型“量子脑”，称为量子 Kolmogorov‑Arnold 网络（QKAN），旨在在未来的容错量子计算机上运行。QKAN 旨在处理庞大的量子数据集，甚至以比经典方法更高效的方式构建复杂量子态，可能为量子机器学习和量子模拟开辟新途径。

从经典数学思想到量子架构

该工作建立在称为 Kolmogorov‑Arnold 表示的数学见解之上：原则上，任何多变量的光滑函数都可以由简单的一变量分量和加法组装而成。最近的“Kolmogorov‑Arnold 网络”（KAN）将这一思想改编为一种经典神经网络设计，它将许多简单的一维激活函数连接在一起，而不是主要依赖矩阵乘法。KAN 在那些底层公式具有结构性和可解释性的科学问题中表现出潜力。作者以此概念蓝图为出发点，提出问题：我们能否构造一个以量子电路语言原生存在的纯量子版本？

将量子矩阵变为“神经元”

在 QKAN 中，基本的信息载体不再是普通数值，而是特殊量子矩阵的特征值。这些矩阵通过一种称为区块编码（block‑encoding）的标准技巧被嵌入更大的幺正操作中。一个强大的技术——量子奇异值变换（quantum singular value transformation）——使得电路可以对这些特征值施加定制的多项式函数，有效地担当神经网络中激活函数的角色。通过在一层或少数几层中排列这些操作，QKAN 能同时作用于指数级大的输入空间——当输入本身是量子态时，经典网络在可比资源下无法做到这一点。

宽而浅的量子网络

作者证明 QKAN 自然实现了“宽而浅”的架构。如果一个量子设备可以高效地对 N 维输入进行区块编码——例如由另一个算法制备的量子态或描述物理系统的哈密顿量——那么一层 QKAN 可以用仅对 N 的多对数开销实现极其宽的变换。堆叠多层代价高昂，因为电路深度会随层数大致呈指数增长且微小误差会累积。因此，QKAN 最适合使用少量层，以宽度上的极端并行性换取深度的节省。论文分析了如何用量子电路参数化这些网络、如何用基于梯度的策略训练它们，以及如何高效读出低维输出。

将量子态制备作为应用场景

除学习任务外，同一构造还可作为制备复杂量子态的工具。作者聚焦于一类重要示例：分布在规则网格点上的多变量高斯分布。他们设计了一个两层 QKAN，第一层通过简单的多项式变换计算每个网格点到原点的平方距离，随后应用精心选择的多项式近似来模拟高斯的指数衰减。当将这种区块编码的变换施加到均匀叠加态并进行放大时，结果是一个振幅近似遵循高维高斯轮廓的量子态。分析给出了所需量子门数和额外量子比特数的明确界限。

量子学习的机遇与局限

对非专业读者而言，关键结论是 QKAN 提供了一种新的、有结构的量子算法语言，将可解释神经网络的思想与先进的量子线性代数工具相结合。原则上，它可以计算量子数据的复杂函数，并以比已知经典方法更少的步骤组装多变量概率景观，前提是存在合适的多项式近似且高效的区块编码可用。与此同时，QKAN 并非一劳永逸的通用方案：其层数必须保持较小，性能依赖于良好的多项式基，并且它继承了经典 KAN 在何种情况下该架构真正优越的未决问题。不过，QKAN 扩展了量子机器学习和态制备的工具箱，指向既强大又结构透明的量子模型。

引用: Ivashkov, P., Huang, PW., Koor, K. et al. QKAN: quantum Kolmogorov-Arnold networks with applications in machine learning and multivariate state preparation. npj Quantum Inf 12, 73 (2026). https://doi.org/10.1038/s41534-026-01202-5

关键词: 量子机器学习, Kolmogorov‑Arnold 网络, 量子神经网络, 量子态制备, 量子奇异值变换