Clear Sky Science · zh

SwinCup-DiscNet：一种融合视杯与视盘特征的融合变换器框架用于青光眼诊断

2026-02-09 · 返回目录

为什么这对保卫视力很重要

青光眼是全球导致不可逆失明的主要原因之一，但常常在没有疼痛或早期警示的情况下悄然发展。眼科医生可以在视力丧失之前，在眼后部发现细微变化，但对每位患者逐一人工检查既耗时又有时不够一致。本文介绍了SwinCup-DiscNet，一种新的人工智能（AI）系统，它读取视网膜照片以早期筛查青光眼，将经典的临床线索与现代深度学习相结合。

观察眼内的神经

要理解该系统的工作原理，先了解青光眼通常如何被发现会很有帮助。眼科专家检查视神经乳头（optic nerve head），即传递视觉信息的神经离开眼球的部位。在这个“视盘”中央有一个较亮的凹陷，称为“视杯”。随着青光眼进展，视杯往往会变得更深更宽，侵蚀周围的神经组织边缘。一个关键指标是杯盘比（cup-to-disc ratio），它比较视杯与视盘的大小。较高的比值通常提示损伤。在成千上万张视网膜照片上手工测量该比率既繁琐，即便是专家也可能存在分歧。SwinCup-DiscNet 自动化了该比率的测量以及对眼睛是否可能患有青光眼的整体判断。

一个同时关注细节与全局视角的双通道AI

该系统在接收视网膜眼底图像时采取两条并行路径。首先，一个分割分支将视盘和中央视杯孤立出来。它使用一种称为Attention U-Net的专门网络，学习突出重要结构并忽略诸如血管和光照伪影等干扰背景特征。一旦识别出视杯和视盘边界，系统对其进行平滑并拟合成清晰的椭圆形，然后测量它们的垂直尺寸以计算垂直杯盘比——这是临床上被信赖的青光眼标志。

学习超出肉眼可量化的模式

在第二条路径中，基于变换器的分支查看整张图像，而不专注于任何单一数值。该分支使用Swin Transformer，这是一种现代深度学习模型，它将图像划分为小补丁并分析它们在整个视网膜中的相互关系。通过这样做，它能够捕捉围绕视神经及其邻近区域在纹理、颜色和结构上微妙的模式，这些模式可能与青光眼相关但难以被人类量化。从这一全局视角，模型输出该图像来自青光眼患者的概率。

将可信线索与AI直觉融合

SwinCup-DiscNet 的核心在于如何合并这两类证据。系统并不只信任杯盘比或变换器给出的概率，而是使用加权规则将它们混合。杯盘比会根据训练数据中的表现进行归一化，然后与模型学习到的青光眼概率合并为单一分数。如果该融合分数超过阈值，则该眼被分类为青光眼；否则被标记为正常。这一设计使决策基于熟悉的临床测量，同时仍然利用AI能发现的更丰富模式。系统还将拟合的视盘与视杯轮廓叠加在原始图像上，为医生清晰地展示驱动决策的区域。

将方法付诸检验

作者在三个广泛使用的公开视网膜图像数据集上评估了SwinCup-DiscNet：LAG、ACRIMA 和 DRISHTI-GS。这些集合在相机类型、图像质量和患者构成上有所差异，使其成为苛刻的测试平台。在所有数据集上，新系统与传统的卷积网络及仅分割杯盘的方法相当或更优。它实现了很高的分割质量、杯盘比估计的低误差，以及接近或超过99%的分类准确率，并且性能曲线显示它很少将健康眼误判为患病。错误分析表明，大多数剩余的误报出现在视杯自然较大但并非真正病变的边界情况，这种权衡在筛查中通常是可以接受的。

这对未来眼科筛查意味着什么

简言之，SwinCup-DiscNet 表明AI既可以“像医生一样思考”，利用诸如杯盘比等既定标志，也可以“看到表面之外”，通过学习视网膜图像中的复杂模式。通过结合这些优势，该系统提供了比许多现有方法更准确且更具可解释性的青光眼筛查。经过对真实医院数据的进一步测试以及可能扩展到疾病分级，这类混合AI有望成为眼科诊所的实用助手，帮助更早发现青光眼并预防可避免的失明。

引用: Chilukuri, R., Praveen, P., Gatla, R.K. et al. SwinCup-DiscNet: A fusion transformer framework for glaucoma diagnosis using optic disc and cup features. Sci Rep 16, 7920 (2026). https://doi.org/10.1038/s41598-026-39065-7

关键词: 青光眼, 视网膜成像, 深度学习, 视神经, 医学筛查