Clear Sky Science · zh

在真实量子硬件上对 MedMNIST 数据集进行基准测试

2026-02-14 · 返回目录

为什么量子计算机关心医学影像

医院会产生大量医学影像——X 光片、扫描图像和显微切片——医生越来越多地借助人工智能来分析这些资料。本研究提出了一个大胆的问题：当今早期的量子计算机是否能开始分担这类工作？作者将一大批多样化的医学影像输入真实的 IBM 量子硬件，以检验量子机器学习在当前阶段能走多远，以及仍然存在哪些不足。

教量子芯片识别医学模式

研究者聚焦于量子机器学习，其中信息由可同时处于多种态并相互影响的量子比特处理，这些特性是经典比特所不具备的。他们并未将量子组件与熟悉的深度神经网络混合使用，而是刻意只采用纯量子模型来测试其独立能力。作为测试平台，他们采用 MedMNIST，这是一个标准化的轻量级医学影像数据集集合，涵盖胸部 X 光、视网膜扫描、皮肤病变、血细胞、结肠组织和腹部 CT 切片。每个数据集都对应不同的分类任务，从类似“是否患有肺炎”的简单二分类问题到类目众多且标签分布极不平衡的复杂多类问题。

把大图像压缩进小型量子设备

由于现有量子处理器规模小且存在噪声，研究团队无法将完整临床影像直接送入量子电路。相反，他们将每幅图像缩减为一个粗糙的网格——采用 7×7 或 8×8 像素的平均池化——再把每个像素映射为作用在量子比特上的一次旋转。这就产生了电路可处理的紧凑量子表示。为了最大化有限硬件的效用，他们使用名为 Élivágar 的自动化设计工具生成“器件感知”电路。该工具采样许多候选电路，遵循 IBM 127 比特 Cleveland 处理器的实际连线和误差特性，对电路的抗噪性和区分图像类别的能力进行评分，并挑选出最有前景的布局以供进一步测试。

在模拟中训练，在真实量子芯片上测试

量子模型首先在无噪声的软件模拟器中训练，该模拟器运行于强大的经典 GPU 上。在这里，电路中旋转门的参数通过常规优化方法调优，直到模拟电路在训练图像上区分度最佳。一旦找到合适的参数设置，团队固定这些参数，仅将推理步骤部署到真实的 IBM 设备上。在硬件上，他们引入了先进的误差处理策略：用于保护空闲量子比特的额外脉冲模式、用于消除相干误差的随机化技巧，以及统计修正读出错误的测量清理技术。在对一个最易受噪声影响的数据集进行的消融研究中，三种策略的结合相比裸跑同一电路能显著恢复丧失的准确率和类别分离质量。

量子模型与经典 AI 的比较

在八个 MedMNIST 数据集上，纯量子模型在仅使用远少于最先进深度网络的特征和参数的情况下仍取得了稳健的表现。例如，在用于肺炎检测的胸部 X 光上，量子模型达到约 85% 的准确率——基本与那些在更高分辨率图像上、拥有数百万可调权重的主流残差网络相当。对于更复杂的多类问题，如视网膜疾病和皮肤病变分类，量子模型落后于最强的经典系统，但仍出人意料地具有竞争力。与在相同低分辨率输入上训练的轻量级经典方法相比，量子电路以远少的可调参数达成了相似的准确率，这表明对于量子设计而言存在有利的“每参数准确率”权衡。

这对未来医学 AI 的意义

对非专业读者来说，核心信息是：即便在噪声众多且规模受限的早期阶段，量子计算机已经能够有意义地处理现实的医学影像基准测试——尽管它们尚未打败最优秀的经典 AI。本工作建立了一个严谨的、可对比的基准：一系列纯量子模型，在模拟中训练并在 127 比特设备上运行，针对多种医学影像类型进行评估，并与成熟的经典方法进行了严格比较。结果表明，量子模型在使用每幅图像更少信息的情况下可以接近经典性能，且智能的电路设计与误差处理技术至关重要。随着量子硬件变得更大、更干净，同样的思路有望推动医学影像分析进入一个量子处理器不仅达到同等水平而且真正优于当今 AI 工具的领域。

引用: Singh, G., Jin, H. & Merz Jr., K.M. Benchmarking MedMNIST dataset on real quantum hardware. Sci Rep 16, 9017 (2026). https://doi.org/10.1038/s41598-026-35605-3

关键词: 量子机器学习, 医学影像, MedMNIST, IBM 量子硬件, 误差缓解