Clear Sky Science · zh

量子去噪自编码器提升视网膜眼底图像质量以用于早期糖尿病视网膜病变筛查

2026-01-21 · 返回目录

更清晰的眼底扫描以保护视力

对数百万糖尿病患者来说，一张简单的眼底照片就能揭示早期的失明预警信号。然而，这些视网膜图像常常由于相机噪声而显得颗粒状或模糊，使得那些能挽救视力的微小细节难以辨认。本文探讨了一种在抗盲斗争中颇为不同寻常的盟友：一种将当代深度学习与未来量子计算相结合的新型图像清理方法，能够为早期糖尿病视网膜病变筛查生成更清晰的眼底影像。

眼底照片中微小细节为何重要

糖尿病视网膜病变是高血糖逐步损伤视网膜精细血管的疾病。医生会寻找血管上的小隆起（微动脉瘤）、细小的分支毛细血管以及微妙的纹理变化，以在视力丧失前发现疾病。这些征兆在标准眼底照片中往往仅占几个像素宽度。不幸的是，筛查中心采集的真实世界图像会受到多种噪声影响：传感器缺陷、光线不足以及运动模糊等。传统的清理工具，例如高斯平滑或中值滤波，能够去除部分噪声，但往往也会抹去医生最关心的那些脆弱结构。

当今“智能”滤波的局限

近年来，深度学习方法已成为医学图像去噪的主力。卷积自编码器、残差网络（ResNet）以及专用的去噪卷积神经网络可以学习“干净”图像的样式，然后从新扫描中去除噪声。这些模型表现良好，但也存在缺点。为了捕捉复杂的图像模式，它们需要许多层和数百万个参数，从而要求大量计算和充足的训练数据。在标注数据相对有限的医学影像领域，这类大型模型容易过拟合——记住训练图像而非泛化——且仍可能模糊细小血管或微小病灶。

把量子思想引入图像处理

作者提出了一种混合方法，称为量子去噪自编码器（QDAE）。乍看之下它类似于标准的深度学习流水线：经典编码器将每张有噪声的眼底照片压缩为一组紧凑特征，经典解码器随后重建清理后的图像。关键的变化发生在中间步骤。QDAE并非直接通过简单的数学瓶颈传递特征，而是将其转换为类量子态并用小型参数化量子电路处理，然后再转换回来。在真实的量子机器中，叠加态可同时考虑许多特征组合，纠缠则能关联图像中相距较远的部分。尽管这项工作在常规GPU上模拟电路，但相同的结构使模型能够用相对较少的可训练参数表示像素之间丰富的非线性关系。

图像更清晰，细小血管得以保留

为测试QDAE，研究人员使用了一个公开的视网膜图像数据集，将图像缩放到224×224像素并用逼真的高斯噪声和散斑噪声进行人工污染。他们将该方法与三个强基线模型进行了比较：卷积自编码器、基于ResNet的模型和一种流行的去噪CNN。所有模型在相同数据上训练和评估，采用标准图像质量评分。量子增强模型在所有主要指标上均名列前茅：其峰值信噪比达到38.8 dB，结构相似性得分为0.96，远高于经典网络。它还更好地保留了图像的原始强度和纹理模式，包括视盘、黄斑以及精细血管网络的亮度和对比度。尽管量子步骤增加了小幅延迟——每张图像大约半秒——由于采用了仅含四个量子比特和三层的浅层电路，整体计算成本与深度CNN相当。

这对患者和诊所意味着什么

对糖尿病患者而言，技术细节归结为一个简单的好处：更清晰的眼底照片能让软件与专家更容易在可通过治疗预防视力丧失的早期发现疾病。QDAE可作为一个智能预清理阶段插入现有筛查系统，辅助后续的病灶分割或疾病分级工具。由于量子部分目前通过模拟实现，医院无需特殊量子硬件即可试用，但其设计已为未来量子设备的成熟做好准备。该研究仍需在来自更多诊所和不同相机的图像上进行更广泛的临床测试，但它也为量子启发式计算如何悄然改进常规眼科检查并最终帮助保护视力提供了耐人寻味的展望。

引用: Chilukuri, R., P, P., Gatla, R.K. et al. Quantum denoising autoencoder improves retinal fundus image quality for early diabetic retinopathy screening. Sci Rep 16, 5970 (2026). https://doi.org/10.1038/s41598-026-35540-3

关键词: 糖尿病视网膜病变, 视网膜成像, 图像去噪, 量子机器学习, 医疗人工智能