Clear Sky Science · zh

一种采用优化深度学习技术的增强型糖尿病性视网膜病变检测方法

· 返回目录

及早发现眼部损伤为何至关重要

糖尿病可能在眼后部的微小血管上悄然造成损伤,最终导致视力模糊甚至失明。眼科医生可以通过检查视网膜的高清照片来发现这种称为糖尿病性视网膜病变的病况。但面对数以百万计存在风险的人群与不足的专科医生,许多患者并未及时接受筛查。本研究探讨如何通过精心设计的人工智能系统更准确、更可靠地解读视网膜照片,从而尽早发现问题,挽救视力。

Figure 1
Figure 1.

眼底影像:一座数据金矿

视网膜照片(又称眼底图像)不仅仅是普通快照。它们记录了光在眼内各层的吸收、反射和散射,揭示血管、微小渗出和瘢痕等细节。这些模式包含大量关于糖尿病损害的线索,但也很复杂:图像在亮度、焦距、相机类型和患者背景上存在差异。早期的计算方法要么依赖人工设计的测量指标,容易漏掉细微变化,要么依赖强大的深度学习网络,但在图像质量或临床环境变化时容易过拟合。挑战在于构建一个能够从这种嘈杂、高维数据中学习且不过于脆弱或不可预测的自动化系统。

教会神经网络识别关键预警信号

作者首先使用现代深度学习模型EfficientNet‑B0作为每张视网膜图像的高级“特征提取器”。网络不再要求医生人工标注每处出血或脂质沉积,而是学习在病变与健康眼睛间持续出现的抽象视觉模式。为增强稳健性,所有图像都经过清理与标准化:调整尺寸、转换为灰度以强调结构而非色彩,并增强以突出微小斑点与血管细节。随后将灰度图像转换为预训练网络可处理的输入格式,并对网络的最后几层进行温和的微调,使其内部滤波器更强烈响应视网膜结构而非日常物体。

让虚拟“草蜢群”挑出最有价值的线索

即便经过深度学习,每张图像仍由一千多个数值特征表示,其中许多是冗余的。将所有这些特征直接送入分类器会减慢训练并模糊不同病期间的区别。为此,团队采用了一种受草蜢运动启发的自然启发式优化器。在其动态草蜢优化算法中,每只“草蜢”代表一组不同的特征子集。经过多次迭代,群体在广泛探索与集中搜索之间取得平衡以发现有前景的组合。关键在于控制参数随时间变化,防止群体过早陷入局部最优。结果是得到一个更小但信息丰富的特征集——大约一百个,而不是1,280个——仍然能编码诸如微动脉瘤聚集、渗出斑块或血管肿胀模式等重要信号。

Figure 2
Figure 2.

多数简单意见构成更强的诊断

系统并不信任单一模型,而是使用若干不同分类器的堆叠集成。支持向量机、贝叶斯网络和决策树各自接收优化后的特征集,并输出眼睛属于某一病期的概率。然后由一种快速的梯度提升方法LightGBM将这些“意见”组合起来,学习在不同情形下如何为每个基模型赋权。该层次化设计降低了单一模型盲点主导结果的风险。作者在包括常用的EyePACS和APTOS等大型公开视网膜图像数据集上测试了他们的框架,并与领先的深度学习管线和其他生物启发式优化器进行了比较。

在接近真实世界的测试中系统表现如何

在多组实验中,动态草蜢—集成框架持续优于竞争方法。在关键基准上其准确率约为94–95%,F1分数较高(在漏诊与误报间取得平衡),ROC曲线下面积约为0.96,表明在健康眼与病变眼之间区分能力强。它在不同的训练—测试划分和额外数据集间具有良好泛化性,并在图像人为加入更多噪声或畸变(以模拟真实诊所变异)的情况下保持大部分性能。相比之下,早期参数固定的群体算法往往过早收敛、保留更多冗余特征,并在具有挑战性或不平衡数据上表现出较低的敏感性和特异性。

这对患者与诊所意味着什么

通俗地说,该研究表明将现代图像分析网络与智能特征筛选群体以及一组简单分类器相结合,可以产生一种快速、准确且相对稳健的糖尿病眼病“第二读片”工具。这样的工具不会取代眼科医生,但可以帮助在专家稀缺的繁忙或资源不足的诊所更早识别高风险患者。作者指出,仍需在本地医院数据上做更多验证并继续降低计算成本,但他们这种考虑物理特性并以优化为驱动的方法,正使自动筛查更接近可被信任的真实世界部署。

引用: Darwish, S.M., Milad, K.G. & Ibrahim, R.E.ED. An enhanced diabetic retinopathy detection approach using optimized deep learning technique. Sci Rep 16, 9825 (2026). https://doi.org/10.1038/s41598-026-41998-y

关键词: 糖尿病性视网膜病变, 视网膜成像, 深度学习, 特征选择, 医疗人工智能