Clear Sky Science · zh
使用 MCN-GNN 的持续更新联邦学习以实现跨分布医院的隐私保护临床事件预测
这对你的健康为何重要
现代医院收集了大量数字化健康记录,但严格的隐私规定和信任问题使得它们难以汇集数据并联合学习。本文提出了一种方法,使许多医院能够共同训练强大的预测工具,用于预测心力衰竭、中风、肝病、肾病和糖尿病等情况——而无需共享原始患者数据。该方法还解决了许多人工智能系统中的一个隐性问题:当新信息到来时,系统往往会“忘记”旧有知识。

多家医院,一个共享的大脑
作者基于一种称为联邦学习的思路:各医院不将患者记录上传到中央服务器,而是在本地训练模型,仅将学习得到的更新发送到共享的全局模型。在这项工作中,数十家医院可以各自关注不同的问题——例如一家预测心力衰竭,另一家预测中风,另一家预测肝硬化——但都为更强大的通用模型做出贡献。这样的设置将数据保留在各自医院内部,同时仍然让所有人受益于数千名患者的汇总经验。
把病历变成网络
为充分利用电子健康记录,团队将每位患者的信息转换为随时间演化的事件网络。在该网络中,医学特征——如年龄、血压、化验结果和症状——被视为节点,节点之间的连边捕捉早期事件如何影响后续事件。这种结构称为时序因果图,旨在识别因果模式而非简单的相关关系。随后,专门的基于图的模型从这些网络中学习,同时使用“均值中心化”步骤防止不同特征过度混合,这是许多图方法常见的弱点。
在模型传输中保护隐私
即便医院仅发送模型更新,这些更新仍可能在被攻击者巧妙分析时泄露隐私。为防止这种情况,作者对各医院的模型变化进行加密,采用一种允许中央服务器直接在加扰后的数值上进行计算而不见原始值的方案。一种特殊的缩放技术将额外的数学“噪声”控制在可接受范围内,从而保证加密训练的准确性。在任何医院的更新被接受之前,强化的数字签名会验证发送者的真实性并确保更新未被篡改。所有主要步骤——注册、训练、聚合和更新——都记录在类似区块链的账本上,提供一条无法被单一方悄然改写的审计轨迹。

确保学习不会过时
现实世界的医院在不断变化:新疾病出现、指南更新、患者群体发生变化。学习系统面临的一大挑战是“灾难性遗忘”,即吸收新模式会抹除先前学到的内容。作者提出了一种持续更新方法,每次将全局模型下发给医院时,都会小心地将旧知识与新信息混合。旧的样本会随着时间减少重放频率,但不会完全消失,这有助于各医院在适应新趋势的同时保留已掌握的内容。
在实践中效果如何?
该框架在五个公开数据集上进行了测试,涵盖心力衰竭、中风、肝硬化、慢性肾病和糖尿病。在这些不同任务中,系统实现了约99%的预测准确率,明显优于多种现有的深度学习和基于图的方法。它还表现出对各种网络攻击的强抵抗力,在数据类型差异很大的医院之间保持了良好的公平性,并能扩展到多轮训练而不会造成过重的通信或计算负担。
这对患者和临床医生意味着什么
简而言之,这项工作表明,医院可以在将患者记录安全地保留在各自防火墙后的前提下,共同构建高度准确的严重临床事件早期预警工具。通过结合隐私保护的训练、稳健的安全校验、持续学习和透明的记录,该系统有望在大型医院网络中支持实时风险警报和更个性化的护理方案——而无需在医疗洞察力和数据隐私之间做出权衡。
引用: Jagdeesh, K., Kanimozhi, N., Sardar, T.H. et al. Federated learning with continual update for privacy-preserving clinical event prediction across distributed hospitals using MCN-GNN. Sci Rep 16, 12608 (2026). https://doi.org/10.1038/s41598-026-40964-y
关键词: 联邦学习, 电子健康记录, 临床事件预测, 隐私保护人工智能, 图神经网络