Clear Sky Science · zh
一项基于人工智能分析的临床恶化随机对照试验
为什么让住院病人安全如此困难
病人入院后,医生和护士会努力发现某人即将病情急剧恶化的早期信号。但在人手繁忙的病房里,人工观察容易错过心率、呼吸或血压的微妙变化。本研究提出了一个迫切的问题:一种在后台默默监视病人生理参数的人工智能(AI)系统,能否实际帮助预防诸如心脏骤停、呼吸衰竭或紧急转入重症监护室等严重突发事件?

为病人打造的新型“天气雷达”
研究团队测试了一种名为 CoMET 的系统,它将床旁监护器的数据流、化验结果和护士记录的生命体征整合为易读的风险可视化图像。每位病人在大屏幕上以明亮的彗星图标出现,其“头部”显示当前风险,“尾巴”显示过去三小时风险的变化。得分1表示未来一天发生严重事件的平均概率;得分越高表示风险越大。与响亮的报警不同,这个系统只是持续显示信息。其想法是,安静且持续可见的风险视图能够帮助医护人员更早注意到令人担忧的趋势,并在病情恶化前去查房。
在真实病房中检验AI
为评估这种显示是否真正产生影响,团队在一所大学医院的一个85床心脏病和心脏外科病房开展了大规模随机对照试验。试验纳入了近两年、涵盖新冠疫情期间的逾万次住院。研究不是对单个病人随机,而是对病房内的房间集群随机分配。有些房间群开启了 CoMET 显示;另一些则按常规护理不显示。所有人都接受标准医疗护理;唯一的不同是医护人员是否能在大屏幕和电子病历中看到风险轨迹。没有强制性的具体行动——临床人员被鼓励但不被要求在分数上升时采取响应。
病人结局如何
主要衡量标准是住院前21天内病人在发生严重恶化前保持无事件的小时数——如死亡、紧急转入重症监护、紧急气管插管、心脏骤停或紧急手术。大多数病人从未发生此类事件,因此获得最大得分21天无事件。总体约有5%的病人经历了严重事件。AI 系统所基于的预测模型表现良好,甚至优于一种常用的早期预警评分,但当研究者比较显示开启组与未开启组时,未发现无事件小时或死亡率上有显著差异。在较小的发生事件的病人群体中,显示开启组在事件发生前往往有更多稳定的小时数,但这一模式不足以达到统计学显著性。

人为决策如何模糊了试验结果
最引人注目的发现之一与数学关系不大,而更多反映了人类行为。试验期间,临床人员经常在床位之间调动病人:有数百名病人从常规护理床位转入有显示的床位,反之亦然。进一步分析显示,病情较重的病人更可能被转入配备 AI 显示的房间。换言之,医护人员似乎认为 CoMET 有帮助,并尝试把高风险病人安排到额外监测的床位,即便试验设计本应保持随机分配。这些床位调动在分析中被视为删失事件,可能稀释了系统潜在的真实效应。该研究还在新冠疫情的压力下进行,这降低了事件发生率并增加了额外复杂性。
这对医院中AI的未来意味着什么
对病人和家属而言,结论既谨慎又充满希望。这项设计良好的真实世界试验表明,仅仅增加一个被动的 AI 风险显示——没有警报也没有严格的响应规则——在这些病房并未显著改善死亡或紧急转运等结局。然而,临床人员将病情更重的病人倾向性地安排到配备 AI 的床位,表明他们认为这些信息有价值。作者得出结论:未来对医院 AI 工具的研究必须超越准确性和样本规模:应追踪临床人员如何解读风险分数、团队如何就其沟通与行动,以及床位分配、工作负荷和罕见事件如何影响结果。AI 仍可能帮助及早发现危机,但要真正提升病人安全,设计者与研究者需要将智能算法与对人类判断、工作流程和医院文化的同等重视相结合。
引用: Keim-Malpass, J., Ratcliffe, S.J., Clark, M.T. et al. A randomized controlled trial of artificial intelligence-based analytics for clinical deterioration. Sci Rep 16, 7345 (2026). https://doi.org/10.1038/s41598-026-39051-z
关键词: 临床恶化, 预测监测, 医院人工智能, 早期预警系统, 心脏病病房