Clear Sky Science · zh

使用混合 Transformer–U-Net 架构的联邦肺结节分割

· 返回目录

为何发现微小肺结节至关重要

肺癌是全球致死率最高的癌症,但其最早的警示信号——CT 扫描上称为结节的微小斑点——很容易被忽视。放射科医师需筛阅成千上万张高分辨率影像,而医院之间共享患者数据以训练更智能的计算机常被严格的隐私规定阻挡。该研究提出了一种方法,使医院能够在不交换原始患者影像的情况下,共同训练一个准确发现肺结节的人工智能(AI)系统。

共享知识而不共享影像

现代 CT 扫描仪能捕捉到亚毫米级的肺部细节,但这种精度也带来了大量影像,单靠人工无法全部审阅。计算机辅助工具可以提供帮助,但它们需要大而多样的数据集以避免漏检罕见结节。HIPAA 与 GDPR 等法律阻止医院将患者数据简单地集中存放。作者采用了一种称为联邦学习的策略来解决这一困境。每家医院在本地用自己的 CT 影像训练同一模型的副本,然后只将模型学习到的参数(而非影像本身)发送到中央服务器。服务器将这些参数平均为一个改进的“全局”模型并返还给各方,使所有机构都能互享彼此经验,同时将患者数据保留在本地。

Figure 1
Figure 1.

在教 AI 之前先清理影像

研究聚焦于直径在 15 到 25 毫米之间的“实性”肺结节,这类结节临床上很重要,但在每张 CT 层片中仅占据少数像素,容易被计算机忽略。在任何学习开始之前,每张 CT 层片都经过两步清理处理。首先,一种称为 CLAHE 的对比度增强方法在不放大噪点的前提下增强微弱结节,使细微斑点更突出。其次,将影像重新缩放到像素值在 0 到 1 之间,为来自不同设备和医院的影像提供一致的亮度尺度。这种标准化的预处理有助于 AI 将注意力集中在微小、低对比度的结节上,而不是被扫描仪差异所干扰。

融合两种观测方式:局部细节与整体背景

系统的核心是一个混合网络,融合了现代 AI 的两大强项:擅长图像目标标注的 U-Net,以及最初为语言开发、现广泛用于视觉任务的 Transformer。模型的 U 型部分先通过小卷积核层压缩影像,擅长捕捉局部纹理——边缘、斑点和细小边界——然后重建为标注结节像素的全尺寸掩膜。残差连接和跳跃连接在网络中传递细节,避免信息丢失。在 U 型结构的中部放置了一个 Transformer“瓶颈”,将影像补丁视作句子中的 token,利用自注意力将远距离区域关联起来。这使得模型既能识别微小结节,又能理解更广泛的解剖背景,这在结节与邻近血管或胸腔结构融合时尤为关键。

Figure 2
Figure 2.

处理稀有目标与不均匀数据

作者还解决了医学影像中的一个主要问题:类别不平衡。在肺部 CT 中,几乎每个像素都是背景;结节像素很少。标准训练往往会奖励那些干脆将所有像素标为背景的模型。为对抗这一点,团队结合了两种损失函数——Dice 损失,直接奖赏预测与真实结节的重叠;以及 Focal 损失,对难以分类的像素赋予更高权重。Dice–Focal 的混合促使模型关注小而困难的结节和清晰边界。在他们使用 LUNA16 公共数据集并模拟五个医院“客户端”的联邦设置中,该系统对实性结节的 Dice 分数最高达到 0.93,并表现出较低的漏检和误报率。尽管影像质量和结节外观存在差异,大多数客户端的性能仍然稳健,尽管密度模糊或混合密度的结节依然具有挑战性。

这对未来肺部筛查意味着什么

简而言之,这项工作表明医院可以在不通过网络传输患者影像的情况下,共同训练出高质量的结节检测 AI。通过结合谨慎的影像清理、兼顾细节与背景的模型,以及针对稀有目标调优的训练策略,该框架在现实的多院环境中能可靠地描绘实性肺结节。尽管在处理极为微弱或部分实性结节方面仍需更多工作,这项研究指向了一类既准确又保护隐私的肺癌筛查工具——在不危及医学影像保密性的前提下,将大数据 AI 的益处带给患者。

引用: Turjya, S.M., Fawakherji, M. Federated lung nodule segmentation using a hybrid transformer–U-Net architecture. Sci Rep 16, 5228 (2026). https://doi.org/10.1038/s41598-026-35243-9

关键词: 肺癌筛查, 医学图像分割, 联邦学习, CT 肺结节, 隐私保护的人工智能