Clear Sky Science · zh

使用深度学习 EfficientNetB0 融合技术的多类眼病分类

· 返回目录

为何及早检查眼睛很重要

视力丧失常常悄然发生。常见眼病如白内障、青光眼和糖尿病性视网膜损伤在症状明显出现之前就可能夺走视力。世界各地尤其在农村或低收入地区,眼科专家无法在合适的时机为所有人做检查。本研究探讨了一种能够读取眼底照片的智能计算机系统,如何利用与现代图像搜索和人脸识别相同类型的人工智能,帮助医生及早且可靠地发现多种主要眼病。

在一张快照中识别疾病

眼科医生已经使用视网膜的彩色照片——眼底的感光层——来查找疾病。在这些图像中,白内障表现为光学通路的混浊,青光眼改变视神经的形态,而糖尿病性视网膜病变则在视网膜上出现微小的渗漏和瘢痕。研究人员收集了 4,217 张高分辨率视网膜图像,按四类平衡分配:健康眼、白内障、青光眼和糖尿病性视网膜病变。通过使用来自多个公开来源的平衡数据集,他们降低了计算机学习到与某家医院、相机或疾病类型相关的捷径(而非真正病变特征)的风险。

Figure 1
Figure 1.

让两个“大脑”协同工作

现代图像识别程序,即深度学习模型,在发现模式方面非常出色,但每种模型都有自身的优势与盲点。团队没有依赖单一模型,而是构建了“双骨干”系统,平行运行两种知名的图像网络,然后融合它们的判断。其中之一是 EfficientNetB0,这是一种紧凑且高效的模型,能捕捉图像的总体结构;它始终作为基础使用。它依次与三种其他模型配对——ResNet50、InceptionV3 和 AlexNet——这些模型分别擅长更深层、多尺度或轻量级的模式识别。系统随后通过多种方式组合两组特征:简单拼接、相加、不同加权或让各模型对最终答案投票。

将系统付诸测试

研究人员在大部分视网膜图像上训练并调优了 12 种不同的模型组合,同时保留部分图像用于评估性能。在内部测试中,表现最好的方法是将 EfficientNetB0 与 ResNet50 的特征拼接,整体准确率约为 95%,并在标准诊断质量指标上几乎达到满分。与 InceptionV3 和 AlexNet 的类似组合也表现良好。为了验证系统是否能应对真实世界的多样性而非仅记住训练集,团队随后在来自两家不同医院、使用不同相机拍摄的 400 张独立图像上测试所有模型。在这里,准确率甚至更高,介于约 95% 到 98% 之间,且所有模型在区分病眼与健康眼方面都保持了很高的评分。

揭开黑箱内部

医生和监管者越来越关心的不仅是“它有多准确?”,还有“它为何这样判断?”。为此,作者使用了 Score‑CAM 和 LIME 等可视化工具。这些工具会突出图像中对模型判定影响最大的区域,将系统的“注意力”以热图形式叠加在视网膜上。对于糖尿病性视网膜病变,被高亮的区域与渗漏血管和靠近黄斑(视力最敏锐的中心)的位置一致。对于青光眼,关注点在视神经头及其周围组织——损伤发生的部位。与白内障相关的判定则强调沿视觉通路的弥漫性混浊。关键是,正常眼并未显示出强烈且错误定位的热点。这种模型关注区域与教科书解剖之间的密切对应,表明系统可能在识别临床上实际使用的相同特征。

Figure 2
Figure 2.

这对日常医疗可能意味着什么

对非专业人员而言,结论是:一张由标准相机拍摄的视网膜照片很快就可能同时用于筛查多种主要致盲原因。双网络结构和智能的融合方法不仅带来了高准确率,还在图像来自新诊所和设备时提供了稳定的结果——这是在现实世界中使用的必需条件。尽管在该技术可在临床上单独指导治疗之前,仍需在更大、更具多样性的人群中进行更多测试,这项工作表明结合不同类型的人工“眼睛”能够提供快速、可信的第二意见。在繁忙的医院、小型诊所或流动筛查单位,这类工具能帮助优先标注最需要就诊的人群,从而有可能挽救数百万人的视力。

引用: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0

关键词: 眼病, 视网膜成像, 深度学习, 青光眼, 糖尿病视网膜病变