Clear Sky Science · zh

可解释且安全的联邦学习：使用轻量多尺度卷积神经网络进行隐私增强的皮肤癌分类

2026-02-28 · 返回目录

为何更智能的皮肤癌检查至关重要

皮肤癌是全球最常见的癌症，早期发现可挽救生命。然而，准确诊断仍然在很大程度上依赖于专家对痣和皮肤斑块图像的细致检查。许多诊所缺乏此类专业知识，而为训练更好的计算工具而共享大量病人图像会带来严重的隐私问题。本研究提出了一种新方法，允许医院在不共享原始病人图像的情况下协同训练强大的皮肤癌检测系统，并为医生提供清晰的可视化解释，说明系统看到了什么。

在不泄露秘密的情况下协作

核心思想是一种称为联邦学习的训练方法。与将皮肤图像发送到中央服务器不同，每家医院将影像保留在本地，并训练同一模型的本地副本。仅将学到的“知识”（模型更新）发送到中央服务器，在那里将其合并为更好的全局模型，再发送回各医院。在这项工作中，作者模拟了若干医院以这种方式在大型公开皮损数据集上合作，使模型从多样化病例中受益，而患者图像始终留在其所属机构。

轻巧但目光敏锐的图像识别器

为使这种协作具备可行性，团队设计了一种新的轻量多尺度卷积神经网络（LWMS‑CNN）。许多流行的图像模型庞大且在医院网络上传输缓慢；相比之下，该模型的可训练参数不到一百万，仅为众所周知架构的很小一部分。其结构并行地在多个细节层次处理每张皮肤图像，从细微边缘和纹理到更广泛的模式，再将这些线索融合。该紧凑设计在准确性和效率上表现出色，在准确率、精确率和F1分数等标准指标上优于或匹配如ResNet和DenseNet等更重的模型，同时体积更小、速度更快——这对在资源有限的医院服务器或甚至边缘设备上使用尤为重要。

以加密保障隐私

尽管联邦学习避免了发送原始图像，但共享的模型更新在复杂攻击下仍可能泄露信息。为弥补这一漏洞，作者在整个交换过程中引入了同态加密，这是一种加密技术，允许服务器在更新仍然加密的情况下对其进行加法和平均运算。医院在发送模型更改前先对其加密；服务器只能看到被打乱的数值，但仍能计算出合并后的更新。只有受信任的一方才能解密聚合结果。测试表明，加入这种保护几乎不影响性能：准确率仅下降约0.3个百分点（从98.62%降至98.34%），这是为大幅增强隐私并符合严格医疗数据法规所付出的很小代价。

为临床医生打开黑箱

仅有高准确率在医学中并不足够；临床医生必须理解算法为何做出特定判断。因此，研究在训练好的模型之上加入了可解释AI工具。一个工具SHAP会突出显示图像中对决策影响最大的部分，将每个像素块视为投票游戏中的“参与者”。另一个工具Grad‑CAM会在病变上叠加热力图，显示网络在判定某处为恶性或良性时关注的位置。结合这些视图，皮肤科医生可以检查模型是否关注有意义的结构——例如不规则边界或颜色变化——而不是头发、照明伪影或背景皮肤，并审查不确定或错误的案例。

从实验室测试到真实诊所

带加密的LWMS‑CNN联邦系统在HAM10000皮损数据集上进行了训练和评估，随后在两个附加数据集ISIC 2019和PAD‑UFES‑20上进行了测试，这些数据集在相机、病损类型和患者群体上存在差异。系统在三者上均取得了较高的准确率，表明该方法具有超越单一数据源的泛化能力。作者还探讨了更具挑战性和更现实的情形，即不同“医院”看到不同组合的病例，并比较了若干种合并模型更新的方法；标准的FedAvg方法表现最佳。虽然实验是在模拟的多客户端设置中运行，而非在物理分离的实际医院中进行，但结果表明，紧凑模型、隐私保护训练和清晰的可视化解释可以整合到单一框架中。对患者而言，这预示着未来的皮肤癌检查将更准确、更广泛可得且更尊重隐私，同时仍将医生牢牢置于决策过程中。

引用: Sayeed, A.S.M., Birahim, S.A., Ullah, M.S. et al. Explainable and secure federated learning for privacy-enhancing skin cancer classification using a lightweight multi-scale CNN. Sci Rep 16, 11414 (2026). https://doi.org/10.1038/s41598-026-41360-2

关键词: 皮肤癌检测, 联邦学习, 医疗数据隐私, 可解释的人工智能, 同态加密