Clear Sky Science · zh
Health-FedNet:在 MIMIC-III 上结合差分隐私与同态加密的慢性病预测安全联邦学习
为什么你的医疗数据需要新型的“锁”
现代医院正依靠人工智能更早地发现疾病并个性化治疗,但这种能力也带来了问题:计算模型在大量患者记录上表现最佳,而这些记录过于敏感,不能简单地集中存放。本文提出了 Health-FedNet,一种让医院在不将患者细节迁出各自机构的情况下,共同训练用于糖尿病和高血压等慢性病的强大预测工具的新方案。它展示了如何在不制造单一点攻击目标或违反隐私法规的前提下,获得大数据医疗的收益。

医院如何在不共享病历的情况下共同学习
Health-FedNet 基于一种叫联邦学习的方法:共享的预测模型发到多家医院,在每个站点上本地训练后以更新的参数返回。与将原始病历集中起来不同,只有这些更新会传输,因此患者信息不会离开医院。中央服务器将所有更新合并以产生改进的全局模型,这一循环重复直到预测稳定。本文作者在著名的 MIMIC-III 重症监护数据库上模拟了医院网络,要求 Health-FedNet 预测谁会发展为糖尿病或高血压。
通过加入噪声与加密隐藏个人信息
仅交换模型更新并不能确保隐私,因为技术高超的攻击者有时能从这些更新反向推断出个体信息。Health-FedNet 通过两层机制来应对这一点。首先,每家医院在其更新中有意识地加入少量数学“噪声”,使任何单条记录的影响变得不可区分。该技术称为差分隐私,它允许作者给出单条记录可能暴露程度的严格数值界限。其次,这些带噪的更新使用一种仍可在加密状态下合并的方法进行加密,因此中央服务器永远看不到明文。两层保护显著降低了外部攻击者——甚至服务器自身——重构私人细节的可能性。
让高质量数据发出更大声音
现实中的医院并不相同:有的接诊更多病人,有的收集的信息更丰富,有的记录更嘈杂。如果把每家机构的贡献一视同仁,低质量数据会拖累最终模型。Health-FedNet 引入了一种自适应加权方案,根据医院持有的记录数量和本地模型的表现对其评分。那些拥有更一致、信息量更大的数据在更新合并时会获得相对更强的权重,同时仍确保没有单一站点主导全局模型。作者表明,这种加权在疾病发生率和记录质量在机构间差异较大时,有助于共享模型更稳定地学习——这在日常医疗中很常见。
系统的预测与保护效果如何
为检验其实用性,团队将 Health-FedNet 与基于汇总数据训练的标准集中式模型以及没有额外隐私工具的基础联邦设置进行了比较。在模拟的医院网络上,Health-FedNet 在慢性病预测上的准确率约为 92%,曲线下面积(AUC)得分为 0.94,明显优于替代方案。与此同时,它大幅降低了攻击者判断某人记录是否用于训练或重构其病历细节的风险,大约降低了三到四倍。尽管加入了加密和噪声,该系统通过对更新的精细打包与加权,也减少了医院与中央服务器之间的通信开销,使其对大规模网络更具可行性。

这对未来数字医疗意味着什么
简单来说,Health-FedNet 表明我们不必在准确的医疗预测与强有力的隐私保护之间做出选择。通过让医院在保留本地病历的同时,共同从数据模式中学习,添加精心校准的噪声,并对更新进行端到端加密,该框架满足了诸如 HIPAA 和 GDPR 等法规的关键要求。研究表明,类似的设计有望成为未来全国性甚至国际性健康网络的基础,使众多机构在不交出原始患者记录的情况下协作预测疾病、发现疫情并指导治疗。
引用: Shahid, M.I., Badar, H.M.S., Asghar, M.N. et al. Health-FedNet: secure federated learning for chronic disease prediction on MIMIC-III with differential privacy and homomorphic encryption. Sci Rep 16, 7968 (2026). https://doi.org/10.1038/s41598-026-36034-y
关键词: 联邦学习, 健康数据隐私, 慢性病预测, 医疗人工智能安全, 医院数据共享