Clear Sky Science · zh

一种用于检测多种眼底疾病的测试时临床自适应框架，利用眼科基础模型

2026-03-02 · 返回目录

为何更智能的眼部筛查至关重要

全球有数百万人面临因糖尿病、青光眼和与年龄相关的眼后部变化等疾病而失明的风险。医生可以通过眼底照片（称为眼底影像）发现许多这些问题，但逐张仔细检查非常耗时，尤其当多种疾病可能同时存在时。本文介绍了RetExpert，一种新的人工智能（AI）系统，旨在像多面手眼科专家一样工作：它能同时筛查多种视网膜疾病，应对杂乱的真实世界数据，并在不同诊所和相机环境中即时自我适应。

同时识别多种眼部问题

典型的眼部筛查AI工具通常只训练用于检测单一疾病，并且常假设影像外观会与训练时使用的图像非常相似。真实的临床环境则不同。患者常常有多种眼部疾病，数据集中的疾病标签不完整，各地的相机和人群存在差异。RetExpert 通过构建在“基础模型”之上的系统来应对这些挑战——这些大型视觉模型先用大量眼底图像进行预训练，已经理解了眼底照片中的常见模式，如血管、视神经与黄斑。RetExpert 将此类模型的模块化单元转化为“自适应知识单元”，并加入小型适配层，便于在不破坏已学到的重要知识的情况下对多病筛查进行微调。

更好利用不均衡且不确定的数据

真实的医学数据通常不平衡：像糖尿病视网膜病变这样的常见疾病出现频率远高于罕见疾病。若直接训练，AI 会过度关注高频疾病而忽视罕见但重要的病变。RetExpert 使用一种训练策略，对弱势病种给予额外关注，从而避免在罕见发现上的性能崩溃。系统还认识到某些预测天然比其他预测更不确定。RetExpert 不产生单一的总体置信度，而是为每一种要检测的疾病估计单独的不确定性分数。这种逐病的不确定性视角更接近临床思维，并允许模型在后续自适应步骤中对脆弱的预测采取更谨慎的处理。

减少相似疾病间的混淆

在实践中，某些视网膜疾病可能外观相似，如果AI 模型自信地给出互相矛盾的答案（例如既判定为“正常”又判定为“黄斑变性”）会尤其有害。为此，作者构建了一个眼底疾病共现矩阵，这是基于医学知识与统计数据总结出的疾病对同时出现概率的结构化概览。在训练过程中，RetExpert 学会将其输出概率与这些医学上合理的关系进行对齐。团队还引入了“混淆分数”，用于衡量模型混淆特定疾病对的频率。在引入共现信息后，诸如黄斑变性与高度近视这样难以区分的疾病对之间的混淆减少了三分之一以上，使预测在临床使用中更可靠。

在测试时自我适应

将AI 部署到各家医院面临的最大障碍之一是“领域漂移”：来自新诊所的图像可能因患者群体、相机类型或成像设置不同而有所差异。传统系统在迁移到新环境时必须重新训练或大幅微调，这既昂贵又耗时。RetExpert 则在使用时执行轻量级的自适应。当遇到一批新图像时，它仅短暂调整其小型适配层和最终决策头，先依据自身特征的稳定性进行引导，再依据按疾病加权的不确定性估计使用伪标签。这些更新是临时的并在每批次后重置，因此核心模型不会随时间漂移，同时在保留安全性和可重复性的前提下获得短期灵活性。

在真实世界中表现如何？

作者在两个用于开发的多病大型数据集上测试了RetExpert，随后又在来自不同国家、相机和临床环境的15个额外公开与私有数据集上进行了评估。在大多数任务中——包括糖尿病视网膜病变、年龄相关性黄斑变性、青光眼、病理性近视变化以及眼部弓形体病（眼弓形体寄生虫感染）检测——RetExpert 达到了或超过了当前领先的视网膜基础模型的表现。它还表现出更高的可靠性，混淆分数更低，并且在模拟新医院和设备的具有挑战性的“分布外”数据集上取得了更强的结果。尽管高度专门化的单病系统在该单一病种上仍可能略胜一筹，RetExpert 缩小了这一差距，同时在一个统一工具中提供了广泛的多病覆盖能力。

朝着可信赖的自动化眼部检查迈出的一步

通俗地说，RetExpert 就像一位经验丰富的全科眼科医生，建立在大型共享知识库之上，配备了处理罕见疾病的工具、能承认不确定性的机制，并可在不需持续再训练的情况下快速适应新诊所。通过结合这些要素——自适应模块、不确定性感知学习、医学先验知识与测试时自适应——该框架能从简单的眼底彩色照片中提供更准确且更可靠的多病筛查。如果进一步开发与验证，此类系统可在规模上支持更早期的致盲性疾病发现，尤其在眼科专家资源有限的环境中意义重大。

引用: Jiang, H., Liu, Z., Gao, M. et al. A test-time clinically adaptive framework for detecting multiple fundus diseases harnessing ophthalmic foundation models. npj Digit. Med. 9, 300 (2026). https://doi.org/10.1038/s41746-026-02480-1

关键词: 视网膜成像, 医学人工智能, 多病筛查, 基础模型, 领域自适应