Clear Sky Science · zh

结合群体智能的联邦学习用于高效且安全的医学影像分析

· 返回目录

为什么更安全的共享学习对医学很重要

现代医院收集大量扫描影像,从胸片到乳腺影像,但严格的隐私规定使得整合这些知识变得困难。本文展示了医院如何在从不共享病人数据的情况下共同训练强大的医学影像人工智能。文章还描述了一种借鉴鸟群和昆虫群体运动方式的做法,使得这种共享学习更快、更准确且更能抵御攻击。

Figure 1. 医院共享的是人工智能的知识,而非患者影像,以在保持数据私密性的同时改进基于扫描的诊断。
Figure 1. 医院共享的是人工智能的知识,而非患者影像,以在保持数据私密性的同时改进基于扫描的诊断。

医院如何在不共享数据的情况下共同学习

该研究基于一种称为联邦学习的概念:每个诊所或医院在本地影像上训练自己的模型副本,然后只将模型的数值更新发送到中央服务器。服务器将这些更新平均成为更强的全局模型并返回,而原始影像从未离开医院。在这项工作中,四个模拟的医疗中心在三类影像上合作:与新冠相关的胸片、可能显示猴痘的皮肤照片以及用于乳腺癌筛查的乳腺摄影。该设置旨在模拟真实情况——不同医院面对不同患者群体,无法简单合并其记录。

让数字群体调优学习过程

联邦学习的一个关键挑战是选择合适的模型参数以及判断哪些影像部分最有用。作者没有手动调整这些选择,而是使用受动物群体启发的“群体智能”。他们结合了两种搜索策略:模拟鸟群既跟随自身最佳经验又跟随群体的粒子群优化(Particle Swarm Optimization),以及更亮的解会吸引其他解的萤火虫算法(Firefly Algorithm)。在每家医院内部,这些群体帮助选择要保留的影像特征以及如何设置学习参数,如步长和模型深度。在中央服务器上,类似的思路用于根据数据质量与性能调整对每家医院贡献的权重。

Figure 2. 类似群体的粒子微调影像特征与模型步骤,使联邦人工智能在更少交流下达到更高准确度。
Figure 2. 类似群体的粒子微调影像特征与模型步骤,使联邦人工智能在更少交流下达到更高准确度。

在新冠、猴痘和乳腺癌影像上的测试

为检验这种混合方法在实践中的有效性,团队在三个公开数据集上训练了深度卷积神经网络。通过数据增强扩大训练影像数量后,他们以准确率、精确率和召回率等标准指标评估结果。最佳配置在新冠胸片上约达96.7%的准确率,猴痘皮肤影像为96.1%,乳腺癌乳房摄影为97.0%。与更简单的联邦方案相比,群体引导的系统在准确率上提高了数个百分点,同时将医院与服务器之间的通信轮数大约减少了四分之一。

在隐私、安全与现实性之间保持平衡

由于患者数据高度敏感,框架在基本联邦设计之上加入了隐私和安全保护层。它对所有传输使用加密,并采用一种称为差分隐私的形式化方法,在共享更新中加入经过严格控制的噪声,以防止追溯到个别患者。作者分析了这对性能的影响,并显示即使在强隐私设置下,各任务的准确率仍保持在94%以上。他们还研究了系统在噪声图像、模拟网络攻击和链路延迟下的表现,发现性能仅有适度下降。在不同地点收集的外部数据集上的测试表明,所学模型能够超出原始训练来源泛化。

这对未来医疗意味着什么

简而言之,论文表明,许多医疗服务提供者可以汇聚其医学影像中的“知识”,而无需汇聚影像本身。通过在联邦学习之上加入群体启发的调优,医院能够获得更准确的AI辅助,以识别新冠、猴痘和乳腺癌,同时减少网络流量并遵守隐私法规。作者认为,这种方法有望使先进的诊断工具在较小或偏远的诊所也能可及,帮助医生更早发现疾病而不危及患者的机密性。

引用: SayedElahl, M.A., Farouk, R.M., Ali, A.E. et al. Federated learning with swarm intelligence for efficient and secure medical image analysis. Sci Rep 16, 14734 (2026). https://doi.org/10.1038/s41598-026-50882-8

关键词: 联邦学习, 医学影像, 群体智能, 隐私保护型人工智能, 医疗保健人工智能