Clear Sky Science · zh
RDE-DR:用于基于眼底图像的糖尿病视网膜病变自动检测的鲁棒深度集成卷积神经网络
为什么眼部扫描对糖尿病患者很重要
糖尿病性视网膜病变是糖尿病的一种并发症,会逐步损害位于眼后部的感光组织。早期发现通常可以在视力丧失前进行治疗。但由专家人工检查成千上万张视网膜照片既耗时又费力。本研究探讨了如何通过精心设计的一组人工智能模型来辅助筛查这些图像,从而更可靠地将高风险人群尽早标记出来,同时让健康患者避免不必要的随访。

在眼底照片中寻找预警信号
研究者关注来自公开数据集 APTOS 2019 的彩色视网膜照片(称为眼底图像)。这些图片显示了细小血管以及出血或渗漏的斑点,这些都提示糖尿病性损伤。团队将原来的五级医学分级简化为一个更适合大规模筛查的问题:该眼是否存在任何糖尿病性视网膜病变。这样任务变为一个自动系统可快速为成千上万名患者做出的二选一决策。
让计算机更容易看清隐藏细节
真实世界的眼底照片在清晰度、亮度和色彩上差异很大,这会干扰计算模型。为减少该问题,作者使用一种称为 CLAHE 的对比度增强技术,以在不夸大噪点的前提下增强局部细节。他们将所有图像调整为统一的小正方形,进行颜色归一化,并在训练时使用随机旋转和翻转,以免系统对单一拍摄角度或光照条件过拟合。数据集按比例划分,四分之三用于训练模型,五分之一保留用于测试系统对新病例的泛化能力。
多模型而非单一模型
研究并不依赖单一深度学习模型,而是训练了四种最初在大型日常照片集上开发的流行卷积神经网络。这些模型在领域内分别为 VGG16、VGG19、ResNet50 和 DenseNet121,并被重新训练以识别健康与病变的视网膜。每个模型单独表现都很出色,在测试图像上约能正确分类 98% 的样本,仅漏判少量病变眼。工作的核心思想是通过若干决策融合方案将它们的优势结合起来,包括简单投票、置信度平均以及更复杂的类模糊逻辑规则。

谨慎地合并模型意见
团队系统地研究了七种融合四个模型输出的方法,所有方法均在相同的训练流程下比较。他们还微调了将概率转换为“有/无”预测的阈值,而不是假定固定的中点。通过扫描多个阈值,他们衡量了准确率、灵敏度和精确度之间的权衡,这对必须同时避免漏诊和过度误报的筛查工具至关重要。研究还超越了简单的准确率,使用受试者工作特征曲线和概率密度图来检视模型在将健康与病变图像区分时的置信度情况。
这些结果对未来眼部筛查的意义
总体而言,集成方法保持或略微提升了已经很强的单模型表现,达到了约 98.6% 的准确率并在类分离指标上得分很高。像多数投票或置信度平均这样的简单方案表现出令人惊讶的稳定性,而某些模糊逻辑方法对设计选择更为敏感,表现更不均衡。对非专业读者而言,主要结论是:将若干训练良好的图像识别器结合起来,在仔细清理图像并调优其投票合并方式后,可以得到更值得信赖的自动化辅助工具。这样的工具不会取代眼科医生,但能帮助他们快速筛选大量视网膜照片,把有限的就诊时间集中在那些眼部出现早期异常的患者身上。
引用: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y
关键词: 糖尿病性视网膜病变, 眼底成像, 深度学习, 集成模型, 医疗筛查