Clear Sky Science · zh
基于深度语言模型的电子实时紧急呼叫中院外心脏骤停早期识别
为何更快识别心脏急症至关重要
当有人在医院外突发心脏停止时,分秒必争。能否存活取决于危机被识别、有人拨打求助电话并开始按压胸部的速度。然而,即便是受过训练的紧急调度员在混乱的通话过程中也可能漏判这些情况。本研究探讨一种先进的基于语言的人工智能系统是否能实时监听紧急呼叫记录并标记可能的心脏骤停,在最关键的第一分钟为调度员提供额外的“耳朵”。

911式呼叫中会发生什么
院外心脏骤停来得毫无预兆,会阻断血液流动并在数分钟内威胁到大脑。旁观者立即开始胸外按压时,生存率会显著提高,常常在电话中由调度员指导。但拨打者可能惊慌、无法准确描述所见,或被听起来像呼吸的异常喘息误导。因此,大约四分之一的病例中,调度员未能识别心脏骤停,从而延误了挽救生命的指令。传统工具通过遵循僵化的问题清单或在通话中识别若干关键词来提供帮助,但这些方法容易被含糊、情绪化或具有误导性的语言所蒙蔽。
如何构建一个“会对话”的人工智能
研究人员开发了名为 DyLM-OHCA 的系统,使用深度语言建模——类似于现代聊天机器人的技术——来分析紧急呼叫的文字记录。该模型不只关注孤立的单词,而是读取呼叫者与调度员之间不断展开的对话。它在来自韩国三个大城市的近159,000次紧急呼叫数据上训练,其中包括超过2,600例经确认的心脏骤停病例。在训练过程中,模型学会将每一段新的词序列转换为对当前通话是否为心脏骤停、其他严重紧急情况或较轻问题的实时估计,而无需为每一句话提供详细标注。
人工智能识别心脏骤停的效果如何
研究团队在从未见过的呼叫上测试 DyLM-OHCA,并要求它在通话前60秒内判断是否发生心脏骤停。与四种依赖人工提取词汇统计特征的既有机器学习方法相比,这一基于语言的系统显著更为准确。按常规汇总指标,它能在超过九成的情况下正确将心脏骤停通话与其他通话区分开来,并在第一分钟内识别出约四分之三到五分之四的真实心脏骤停案例。平均而言,它在通话大约20秒时发出首次警报——比一些早期研究报告的计算模型快出20秒以上——同时将错误警报控制在每十通话中不到一次的水平。

人工智能实际上在听什么
为了解系统的判断依据,研究人员检查了对话中哪些部分最强烈地推动模型发出心脏骤停警示。模型并不是锁定某个“魔法词”,而是响应模式:例如调度员询问当事人是否有意识或在呼吸,随后拨打者说出“叫不醒”等表述或暗示情况很严重。模型还会追踪自身置信度随时间的变化。在大多数真实的心脏骤停通话中,一旦风险评分上升就会持续处于高位;而在超过一半的误报中,风险评分早期达到峰值后随着通话揭示出更可能是癫痫发作或呼吸性发作等其他紧急情况而下降。
这如何帮助真实的调度员
从实用角度看,DyLM-OHCA 被设计为静默的辅助工具,而非替代人工判断。随着通话进行,它会持续更新一个风险信号供调度员查看,并提供哪些近期短语触发了警报的简要解释。这种上下文可以使系统的警示比旧有黑箱模型更易被信任,并可能促使调度员提出更有针对性的问题或在关键时刻更早指示胸外按压。该研究基于一个国家的韩语通话数据并尚未进行现场试验,但结果表明,会话感知型人工智能有望显著提升心脏骤停的早期识别并最终改善存活率。
引用: Choi, HJ., Hwang, M., Cho, S. et al. Deep language model-based early recognition of out-of-hospital cardiac arrest from real-time emergency calls. npj Digit. Med. 9, 307 (2026). https://doi.org/10.1038/s41746-026-02498-5
关键词: 心脏骤停, 紧急呼叫, 人工智能, 语言模型, 调度员辅助心肺复苏