Clear Sky Science · zh
通过量子联合分布学习克服离散扩散模型的维度因式分解限制
为什么这项结合 AI 与量子技术的新思路很重要
现代人工智能系统在生成文本、图像和其他数据方面表现出色,但当数据的许多部分之间存在强关联时,它们仍然会遇到困难。本文指出,一类主要的生成式 AI 模型——离散扩散模型——存在内在限制:随着数据维度增加且相关性增强,其误差可能迅速增大。作者提出一种利用量子计算机更忠实地学习复杂关系的新方法,有望比当前的经典技术产生更快、更灵活的生成模型。

把事物拆开反而会破坏关键信息
经典离散扩散模型通过逐步向数据加入噪声并学习逆向过程来生成新样本。为保持计算可控,它们将每个维度——例如图像中的每个像素或序列中的每个符号——视为独立变化的单元。这种“因式分解”避免了复杂度的指数增长,但同时忽略了维度之间的相关性。作者分析了一个极端情况:数据的每个部分都与其它部分强关联。他们证明,在这种情况下,真实分布与因式化模型所能学习到的分布之间的不匹配大致会随着维度数线性增长。换言之,随着数据规模和结构复杂性增加,经典离散扩散模型在捕捉信息片段相互依赖关系方面会出现根本性失败。
用量子态保持相关性
所提出的量子离散去噪扩散概率模型(QD3PM)通过将数据表示为量子态而不是独立的经典变量来应对这一问题。在量子系统中,一组量子比特天然存在于极大的联合空间中,联合配置和相关性共同被编码。QD3PM 将离散数据嵌入该空间,应用通过量子通道添加噪声的受控“扩散”过程,然后通过可训练的量子电路学习逆转该过程。关键在于,模型作用于完整的联合态,因此维度之间的相互依赖在扩散与去噪过程中得以保存。作者利用适用于量子理论的贝叶斯规则变体推导出应指导训练的精确“后验”量子态,并设计了可以物理实现该更新的电路。
从多次缓慢迭代到一次量子跳跃
标准扩散模型通常需要多轮渐进去噪才能将纯噪声转变为逼真的样本,这使得它们在计算上代价高昂。QD3PM 首先以这种熟悉的迭代方式进行描述,但作者随后展示了如何训练相同的量子电路以在一步内直接从噪声生成干净数据。他们通过让量子电路学习在有噪声输入条件下原始数据的分布,然后将该学习到的映射与量子扩散和更新规则谨慎地组合来实现这一点。借助量子操作与测量的性质,最终采样只依赖于量子态的某些对角元,这使得在不改变可观测结果的情况下可以简化程序。这产生了一个单步生成器,理论上可能比经典的多步扩散快得多,同时仍能建模完整的联合分布。

在不重头开始的情况下填补空白
QD3PM 的一个实际优势是它自然处理条件任务(例如图像修补——在已知区域的条件下填补缺失部分)。由于模型描述了所有维度的完整联合分布,作者可以通过在去噪步骤中重复重置已知部分同时允许未知部分变化,来对已知值进行条件化。这种方法在不改变电路或重新训练的情况下温和地引导采样过程朝向正确的条件分布。在包含高度结构化“条纹与横条”模式的合成数据集上的模拟表明,QD3PM 不仅比经典扩散模型和依赖因式分解的量子模型更准确地拟合整体分布,而且在现实的量子硬件噪声水平下表现稳健,并且在条件生成任务上表现良好。
这些结果对未来意味着什么
总的来说,分析与实验表明,当数据高度相关时,将各维度视为独立是离散扩散模型的严重瓶颈。通过改用量子态直接学习联合分布,QD3PM 避免了这一限制,在理论上可以在经典因式化方法无法匹配复杂目标分布的情况下完美拟合它们。该工作还展示了量子生成模型不仅能提供更强的表达能力,还能带来实用优势,例如更快的单步采样和无需重训练的灵活条件推断。尽管当前演示局限于可在经典计算机上模拟的相对小型系统,但该框架为新兴量子硬件未来如何增强生成式 AI 的核心机制提供了清晰的路线图。
引用: Chen, C., Zhao, Q., Zhou, M. et al. Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning. npj Quantum Inf 12, 49 (2026). https://doi.org/10.1038/s41534-026-01188-0
关键词: 量子生成模型, 扩散模型, 联合分布学习, 高维相关性, 条件生成