Clear Sky Science · zh
一种基于零样本学习的可泛化眼病检测方法
为何早期眼部预警很重要
许多严重的眼部疾病始于肉眼难以察觉的微小改变,即便是受过训练的专家也可能难以发现。轻度糖尿病视网膜病变(DR1)就是这样一种沉默的预警:早期发现可以预防视力丧失,但这需要对视网膜照片进行细致检查,并且用大量专家标注的图像来训练现有的人工智能(AI)系统。本研究提出了一种新型AI方法,它能够在医生从未标注过该具体病变的情况下学习识别早期病变,可能为更快速、更廉价的全球眼病筛查铺平道路。
一种无需“答案”教机器的新方法
研究者基于一种称为零样本学习的概念——AI在未见过标注样本的情况下学习识别新事物。该方法不依赖记忆疾病标签,而是模仿临床医生的推理方式:寻找具有相似视觉模式的相关疾病,并将从这些疾病中学到的知识迁移过来。研究团队聚焦于轻度糖尿病视网膜病变(DR1),但在训练过程中没有使用任何标注为DR1的图像。取而代之的是,他们构建了一个名为LCFP-14M的大规模视网膜照片资源,整合了超过一百万张图像和来自多个公开数据库的十一类眼病。这种丰富的图像混合为AI提供了可用于推断病变模式的视觉“经验”。

寻找相似的“替代”疾病
为了确定从何处借用知识,系统的第一步是量化不同眼病在外观上的相似度。团队使用了Siamese(孪生)神经网络——成对的相同AI模型同时检查两张视网膜图像,并学习判断它们是否很可能属于同一种疾病。通过比较成千上万的图像对,模型建立了十一种疾病与轻度糖尿病视网膜病变之间的相似性图谱。它发现,病变性近视(涉及眼后部拉伸和变薄)的视网膜图像与这些早期糖尿病变化相关性最强。从临床角度看,病变性近视成为了可以教会系统关注要点的“最近的表亲”。
教AI识别微小病灶的模样
一旦找到合适的“教师”疾病,下一步就是向AI展示哪些视网膜局部区域对于早期糖尿病损伤最关键。研究者使用第二个模型U‑Net,在已有专家标注的数据库上训练分割系统,这些标注涵盖三种关键征象:血管小囊样膨出(微动脉瘤)、小型出血和苍白的棉絮斑。尽管这些征象并非轻度阶段独有,但它们共同描绘了视网膜循环早期损伤的路径。U‑Net学会了在图像上突出这些病灶,将原始照片转化为聚焦的地图,使重要的预警信号显现出来,而相对不重要的细节则被弱化。

将未见过的病变划分为健康与非健康
在获得以病灶为中心的视图后,系统处理了病变性近视患者的图像,但强调了类似糖尿病的病灶并抑制了与该特定疾病相关的伪影。第三个模型基于ResNet网络并结合凝聚聚类算法,将这些分割后的图像转换为紧凑的数值描述,并将它们分为两个自然簇。关键在于,该算法在无任何指示哪些眼睛健康或有病的标签下完成了组织;它仅依据共享的视觉模式对图像进行分组。当团队随后在独立测试集上将这些簇与真实临床标注进行比较时,其中一个簇与DR1对齐,另一个簇与非病变眼对齐,表明AI实际上已经自主“发现”了轻度糖尿病视网膜病变。
新方法的表现如何
为了评估这套零样本系统的实用性,研究者将其与常规的“少样本”深度学习模型进行了比较,后者允许查看少量带标签的示例。他们测试了常见架构如ResNet、VGG、MobileNet 和 AlexNet,均在有限标注数据上训练,然后在名为EyePACS的外部数据集上评估。尽管训练期间从未展示过标注的DR1图像,零样本模型仍达到了约83%的准确率并取得较高的曲线下面积(AUC)分数,在多数有监督对手中表现更好——尤其在精确度上,意味着它标记为病变的眼睛通常确实存在风险。消融实验(去除个别组件的测试)证实了疾病相似性步骤和病灶分割步骤对这一良好表现都是必不可少的。
这对未来眼科保健意味着什么
通俗地说,这项工作表明,AI可以通过从相关疾病的类比推理和专家定义的视觉线索中学习来识别早期糖尿病性眼损伤,而不必依赖成千上万张精确标注的同类病例。这可能对那些专家标注昂贵或稀缺的地区的筛查项目,或对尚无大规模数据集的新识别眼病,带来重大影响。尽管该方法仍面临一些挑战——例如扩展到眼底照片以外的成像技术,以及让其决策对医生和患者更透明——但它指向了一个前景:使用远少于当前系统所需标注数据的方式,帮助临床医生更早地发现微妙的眼病。
引用: Pan, C., Wang, Y., Jiang, Y. et al. A generalizable eye disease detection method based on Zero-Shot Learning. Commun Med 6, 249 (2026). https://doi.org/10.1038/s43856-026-01439-3
关键词: 糖尿病视网膜病变, 视网膜成像, 零样本学习, 医学人工智能, 眼病筛查