Clear Sky Science · zh
SYN-OCT:来自健康与青光眼眼睛的眼部光学相干断层扫描合成数据集
假眼部扫描为何关乎真实患者
青光眼是导致失明的主要原因之一,现代眼科诊所依赖对眼底的详细扫描来及早发现该病。但要开发能读取这些扫描的智能程序,需要大量患者数据,而这些数据因隐私规定难以共享。本文介绍了 SYN-OCT,这是一个大规模、完全合成的眼部扫描集合,其外观和行为类似真实数据,为研究人员在不暴露任何个人医疗信息的情况下构建和测试青光眼检测算法提供了新途径。

以横截面观察眼睛
该工作以一种常见的眼部成像检查——光学相干断层扫描(OCT)为核心,OCT 捕获视网膜的横截面“切片”。作者关注的是围绕视神经拍摄的环形扫描(circumpapillary scans),用于测量视网膜神经纤维层(RNFL)。该层很关键,因为随着青光眼对视神经的损害而变薄。在日常诊疗中,医生会比较这些扫描中健康眼与青光眼患者的 RNFL 模式,以帮助诊断疾病并监测其进展。
从无到有生成逼真图像
为了构建合成数据集,团队首先收集了新加坡眼科研究所 2012 至 2021 年间近两千只眼睛的真实 OCT 扫描。一个组包括临床确诊的青光眼患者;另一个组由无重大眼病的成年受试者组成。研究者没有直接共享这些真实图像,而是使用一种称为生成对抗网络(GAN)的技术分别训练了两个图像生成系统——一个用于健康眼,一个用于青光眼。在这种设置中,一个网络尝试创建逼真图像,另一个则试图区分真伪,双方互相推动改进,直到生成图像与真实 OCT 扫描高度相似。
检验假图像是否具备真实含义
生成看起来逼真的图像还不够;它们必须在医学意义上与真实扫描一致。作者首先使用标准图像质量评分确认合成扫描在外观上接近原始图像,然后请经验丰富的眼科医生对样本进行评审。专家只能略微高于随机猜测地判断真伪,表明这些假图在视觉上非常具有欺骗性。为了更深入地检验,团队将所有图像——真实和合成——输入一个自动化工具,该工具测量视神经周围的 RNFL 厚度。合成扫描的整体模式和平均厚度值与真实扫描相匹配,并且仍保留了一个关键的医学特征:青光眼图像的神经层持续比健康眼更薄。

将合成数据付诸考验
最严苛的测试是这些人工扫描能否在训练诊断工具时替代真实患者数据。研究者用仅包含真实图像训练了一个深度学习模型以区分青光眼与健康眼,又用仅包含合成图像训练了另一个模型。随后,两者都在来自本地患者和罗马尼亚一家独立医院的未见数据上进行评估。仅用合成扫描训练的模型表现至少与用真实数据训练的模型相当,在某些情况下甚至略有优越,这表明高质量的合成图像可以帮助构建在不同临床环境中具有良好泛化能力的鲁棒工具。
通往更智能眼保健的安全捷径
对普通读者而言,关键信息是 SYN-OCT 提供了一种在不泄露真实个人隐私细节的情况下“借用”大型医学数据集价值的方式。通过展示计算机生成的眼部扫描既能模仿真实图像的外观,又能复制重要的医学测量,并能成功用于训练青光眼检测系统,这项工作指向一个未来:医院和实验室可以更自由地共享丰富的影像资源。这将加速开发更好、更公平、经受更广泛测试的青光眼筛查工具,从而在保护患者隐私的同时,及早发现并阻止青光眼夺走视力。
引用: Wong, D., Sreejith Kumar, A.J., Chong, R.S. et al. SYN-OCT:A synthetic dataset of ocular optical coherence tomography images from healthy and glaucoma eyes. Sci Data 13, 637 (2026). https://doi.org/10.1038/s41597-026-06946-5
关键词: 青光眼, 合成医学数据, 光学相干断层扫描, 眼科中的深度学习, 医学影像隐私