Clear Sky Science · zh

在分布转移下评估ICU中基于深度学习的败血症预测模型：一项多中心回顾性队列研究

2026-03-03 · 返回目录

为何对感染进行早期预警很重要

败血症是一种进展迅速、危及生命的感染反应，也是重症监护病房的重要致死原因之一。医院正转向人工智能，以便在监护仪和实验室检测中及早发现细微的警示信号，在医生明显察觉败血症之前数小时就发出预警。但问题在于：在一家医院表现良好的算法常常在另一家医院失效，因为患者群体、设备和记录方式在不同地点存在差异。本研究提出了一个面向实际护理的实用问题：在存在这些差异的情况下，将败血症预测模型带到新的ICU时，采用何种重用或适配策略最为明智？

医院数据如何在不声张中发生变化

研究者首先展示了不同医院的重症监护数据会有多大差异。他们比较了来自美国和瑞士的三个大型ICU数据库，这些数据都经过精心规范化以跟踪相同的生命体征和实验室结果随时间的变化。即使在这种规范化之后，48项测量信号中的许多——例如血压、血氧水平和某些血液计数——在不同机构之间仍呈现明显不同的模式。统计检验表明，在每一对医院之间，都有数十个变量遵循不同的分布，而且有些特征在各数据集中表现得独一无二。总体而言，两个美国数据集彼此更为相似，而与瑞士数据集相比差异更大，这强调了国家层面的诊疗习惯和测量方式会在数据上留下“指纹”，算法必须学会解释这些差异。

在多家重症监护病房中测试AI

在确认这些差异之后，研究团队训练了三类深度学习模型，以在败血症被正式诊断前约六小时进行预测。随后他们测试了在一家ICU训练的模型直接用于另一家ICU时会发生什么。总体来看，模型的迁移表现相当可观，尤其是在目标ICU自身数据极少的情况下。例如，当本地记录仅占很小一部分时，使用在外部预训练的模型通常优于从零开始训练的新模型。卷积神经网络在跨站点稳定性方面表现最佳。随着更多本地数据的加入，性能稳步上升并最终趋于平稳，有些医院（尤其是大型的美国多中心数据集）比其他医院更容易建模。

尝试不同的模型迁移方式

接着，作者比较了当医院逐步积累本地数据时部署这些模型的实用策略。他们考察了五种选项：直接复用原始模型；仅微调模型的最后几层；用本地数据完全重新训练所有层；仅用本地数据训练一个全新模型；以及两种“领域自适应”方法，这些方法明确将源头和目标医院的内部特征对齐。他们按照本地数据量将目标医院分为小、中、大三种情形，并在若干源-目标对和模型类型上重复对比。这种系统化的方法模拟了现实世界的推广情形，从病例稀少的小型乡村ICU到汇聚数万次住院记录的全国性网络。

在不同数据规模下何者最有效

结果对依赖简单微调的常见做法提出了挑战。在各种条件下，微调通常落后于其他方法。当目标ICU仅有少量病例时，最佳选择是以外部模型为初始值，然后用本地数据对其所有层进行彻底重训练；将源与目标数据合并为一个训练池（融合）则紧随其后。对于中等规模的数据集，领域自适应方法——即通过技术手段促使来自两家医院的特征模式更为重叠——带来了最可靠的增益，提升了判别性能并降低了不稳定性。一旦目标ICU积累了大量数据，完全或主要基于本地数据训练的模型（有时配合额外的融合）则能匹敌或超越所有基于迁移的方法。

这对患者护理意味着什么

对非专业读者来说，核心信息是：在不同医院间部署败血症AI没有一劳永逸的做法。因为每个ICU都有其独特的“数据口音”，简单地直接导入模型并仅微调其最后一层——这类常见的捷径——可能会损失性能，甚至误导临床决策。相反，研究提出了一个简明的方案：在极度缺乏数据的环境中，从外部模型出发并彻底重训练；随着更多本地病例的积累，转向考虑医院差异的领域感知训练；当存在大量本地数据时，应优先采用主要基于该本地经验构建的模型。遵循这些原则可帮助医院更快上线败血症预测工具，同时使警报更可信、更加适应本院患者。

引用: Tranchellini, F., Farag, Y., Jutzeler, C. et al. Evaluating deep learning sepsis prediction models in ICUs under distribution shift: a multi-centre retrospective cohort study. npj Digit. Med. 9, 306 (2026). https://doi.org/10.1038/s41746-026-02364-4

关键词: 败血症预测, 重症监护, 深度学习, 领域自适应, 分布转移