Clear Sky Science · zh

一种用于像素化彩色图像的量子增强分类的新型量子卷积神经网络框架

2026-03-27 · 返回目录

在模糊图像中看得更清楚

现代生活离不开图像，从医学扫描和卫星照片到表情符号与电子游戏小图标。随着这些图像集合的增长，负责分析它们的计算系统面临两难：大型且复杂的模型需要庞大的数据集和大量能量，而许多实际任务只能使用少量小尺寸、低分辨率的图片。本文探讨量子物理的非直觉规则是否能帮助计算机在这些小规模、嘈杂的图像中比现有常规工具更可靠地发现模式。

为何微小图像是大挑战

经典卷积神经网络（CNN）通过用小滤波器扫描图像并学习多层模式，已经彻底改变了图像识别。它们在大且细节丰富的图像以及海量数据集上表现出色，比如用于网络照片标注的那些数据。然而，在许多实际场景——嵌入式传感器、低成本相机、遥感或图标大小的显示器——只有 4×4 或 8×8 像素的小图像可用，且通常数据量有限。在这种低数据情形下，标准 CNN 往往过拟合：记住训练样本而非学习通用规则，导致在已知图像上精度很高，但对新样本表现很差。

将量子物理引入视觉任务

作者提出了新型量子卷积神经网络（No-QCNN），一种使用传统计算机与模拟量子设备的混合模型。核心思想是将每个微小的彩色图像表示为一组量子比特（qubit）。方法不是把原始像素值直接输入网络，而是先把每个像素的红-绿-蓝强度及其位置转换为一个紧凑的三维数据块。然后使用精心选择的旋转和成对量子比特之间的纠缠操作将该数据块编码为量子态。由于量子比特可以处于叠加态并发生纠缠，一个量子态在原理上可以同时表示许多像素颜色与位置的组合，从而在不需要非常深的网络的情况下，自然捕捉到微妙的关联。

量子网络如何处理图像

图像一旦存储到量子比特中，No-QCNN 就通过一系列与经典 CNN 类似但完全在量子电路上运行的步骤来处理它。成对的量子比特经历小而重复的变换块，类似于卷积滤波器的量子对应物，混合来自相邻“位置”的信息。在每次这样的量子“卷积”步骤之后，量子池化操作会减少有效量子比特数，将两个量子比特的信息折叠到一个中。层层推进，电路最终缩小到仅有几个量子比特，其测量结果经过经典后处理步骤解释为预测的类别——例如线是水平还是垂直及其颜色。所有这些量子操作的参数通过经典优化器自动调整，将整个装置视为可训练模型。

量子方法与经典方法的比较测试

为评估 No-QCNN 的效果，研究者构建了简单但能说明问题的图像数据集。在基础任务中，每个 4×4 图像包含一条在噪声背景下的亮线，且为水平或垂直，构成二类问题。在更具挑战性的任务中，8×8 图像包含一条可能为水平或垂直并且为红、绿或蓝三色之一的线，共有六种组合。为公正比较，量子模型在无噪声的模拟器上运行，其性能与复杂度相当的紧凑经典 CNN 进行比较。在二类任务中，经典 CNN 在验证集上取得了完美准确率，而 No-QCNN 达到约 90%，表明对于结构清晰的简单问题，常规方法仍占优势。然而在样本仅有 50 张的更复杂六类问题上，情况反转：No-QCNN 达到约 82% 的验证准确率，而经典 CNN 降至 40%，这是强烈过拟合的迹象。

量子视觉最有用的情形

实验既揭示了希望也指出了局限。随着作者增加数据集规模与训练时长，No-QCNN 的表现逐步下降。固定的量子比特数与浅层电路深度意味着模型难以轻易吸收更多数据，且反复对量子态采样会在训练过程中引入噪声。然而在小规模且富含关联的数据集中——尤其是每类样本极少的六类任务中——量子模型的泛化能力优于经典 CNN。通俗地说，量子电路更能抵抗记忆训练图像的诱惑，而是学到能更可靠迁移到新样本的规则。

这对未来意味着什么

对非专业读者而言，关键结论是：量子版神经网络并非对所有图像问题的万能加速器，也尚未准备好取代今天的深度学习系统。相反，这项研究指出了一个现实的先行应用领域：那些图像尺寸微小、数据稀缺且模式细微、经典模型易过拟合的任务。No-QCNN 表明即便在当下早期且存在噪声的量子平台（本文采用模拟器），精心设计的量子电路在泛化能力上可以与经典 CNN 竞逐，甚至在某些情况下超越，尽管训练时间更长。随着量子处理器变得更强大并减少错误，像 No-QCNN 这样的架构有望发展为医学、遥感等领域的专用视觉工具。

引用: Daka, C., Bhattacharyya, S. A novel quantum convolutional neural network framework for quantum-enhanced classification of pixelated colour images. Sci Rep 16, 10828 (2026). https://doi.org/10.1038/s41598-026-45140-w

关键词: 量子机器学习, 图像分类, 量子神经网络, 低分辨率图像, 混合量子-经典模型