Clear Sky Science · zh
一种用于从视盘照片检测青光眼的视觉变换器模型
这对日常视力有何意义
青光眼是全球导致永久性失明的主要原因之一,但它常在没有明显症状的情况下缓慢发展,直到视力已严重受损。好消息是,眼底的简单照片在许多地方都可获得,即便是在设备有限的门诊。本研究探讨了一种先进的计算程序是否能查看这些照片并可靠地标记出早期青光眼迹象,远在大多数人察觉到问题之前。
一种静悄悄的视力威胁
青光眼会慢慢损害视神经——将视觉信号从眼睛传到大脑的纤维束。医生通过观察视盘(视神经离开眼球的那一点)的变化来判断,但这些微妙形态的解读十分困难,甚至专家之间也常有分歧。许多地区还缺乏足够的眼科专家来对大范围人群进行筛查。因此,全球约有一半的青光眼病例可能未被诊断,尤其是在中低收入国家,很多人只有在视力已丧失相当程度后才知道自己患病。
教计算机读懂眼底照片
研究人员收集了来自美国一家眼科中心治疗的早期青光眼患者的千余张视盘照片,以及来自两个公开图像数据库的数百张健康眼照片。青光眼专家仅根据视神经的外观对每张图片进行分级,判断为青光眼或健康,并排除了伴有其他视网膜问题的眼睛。团队将每张图像裁剪,使视盘在画面中占据相似比例,并通过严格的质量检查和现实的图像变换(如轻微旋转、缩放和模糊)来扩充训练集,同时保持与真实世界条件的一致性。 
一种新的神经网络类型
研究团队没有依赖传统的图像分析系统,而是基于“视觉变换器”构建模型——这是一类较新的深度学习工具,最初用于识别日常照片中的物体。该模型将每张视盘图像切分为许多小补丁,将每个补丁表示为一个数据标记,然后使用多层注意力模块来评估视盘不同区域之间的相互关系。网络输出一个介于 0 与 1 之间的分数,反映该眼患青光眼的可能性,分数≥0.5 计为阳性。为充分利用可用数据,研究人员采用了平衡抽样、加权损失函数和交叉验证,并将变换器与一种名为 EfficientNet 的强大卷积网络进行了比较。 
系统识别早期疾病的效果如何
在未见过的测试图像上,视觉变换器模型几乎完美地区分了青光眼眼与健康眼。其主要性能指标——受试者工作特征曲线下面积(AUC)在测试集上为 1.00,准确率约为 99%,灵敏度和特异性都非常高。换句话说,该系统几乎不漏检青光眼病例,并且很少将健康眼误判为患病。当研究者随后用近千只中度至晚期青光眼的眼睛挑战模型时,模型仅错过了其中一例。该变换器的表现也优于基于 EfficientNet 的方法,后者准确率较低且误报与漏检更多。
这对眼保健可能意味着什么
由于该模型可处理标准视盘照片且在种族多样的患者群体上训练,它提供了一个现实的前景,展示人工智能如何在世界许多地区协助青光眼筛查。作者提醒,本研究的总体样本量小于某些其他研究,且对多数健康对照依赖外部数据集,这可能引入隐藏偏差。他们认为,构建更大且更多样化的图像集合、使用便携相机采集的图像以及纳入年龄或近视程度等基础患者信息将是重要的后续步骤。尽管如此,研究结果表明,对简单眼底照片的智能分析有望成为一种具有成本效益的早期发现青光眼并减少可避免失明的方法,尤其是在缺乏专家的地区。
给读者的要点
这项工作表明,先进的计算模型可以通过常规的视神经照片学习识别青光眼的早期特征,且准确率非常高。尽管还需要在真实临床环境中进行更多测试,此类工具未来有望帮助医生快速将大量患者分为需要紧急眼科服务者与无需紧急处理者,从而在全球范围内更早、更广泛地保护视力。
引用: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7
关键词: 青光眼筛查, 视盘摄影, 深度学习, 视觉变换器, 眼健康