Clear Sky Science · zh
一种整合结构化数据与临床文本的深度学习模型用于预测房颤复发
这对心律不齐患者意味着什么
房颤是一种常见的心律失常,即便患者接受了旨在恢复正常心跳的侵入性导管消融手术,仍常出现复发。许多患者和医生都会问:谁最可能再次发生,谁可以相对放心?这项研究展示了现代人工智能如何同时处理数值数据和病历中的医生记录,更精确地预测房颤复发的概率,从而有望指导随访护理并减少重复手术。
一种常常复发的棘手心律问题
导管消融通过灼烧或冷冻心脏内部触发或维持异常节律的微小区域来治疗房颤。然而,30–50% 的患者在一年内会出现心律异常的复发,有时需要再次手术。现有的风险评分大多基于若干测量值(如心腔大小和房颤类型),仅能提供部分信息。它们通常忽略了关于手术过程的细节、超声下心脏的表现以及埋藏在文本报告中的患者整体状况的细微差别。因此,临床医师仍难以识别谁真正需要特别密切的监测或额外的预防性治疗。
将常规住院数据转化为更智能的预测工具
中国的研究团队收集了2015年至2024年间在五家医院接受房颤消融的2,508名患者的数据。典型患者年龄为65岁,近三年中位随访期内约五分之一患者出现复发。对每位患者,团队收集了结构化数据(如年龄、血压、血液检验结果、心腔大小和既有风险评分)以及非结构化文本,包括24小时心电监测摘要、超声报告和电生理医师撰写的详细手术记录。随后他们构建了一个双分支深度学习模型:一支处理数值与分类数据,另一支利用大型语言模型将自由文本报告转化为可与数值数据联合使用的量化特征。

先进语言模型如何“读”医生笔记
系统的文本分支依赖四种现代大型语言模型,这些模型最初在海量文本上训练,随后针对医学语言进行了调整。这些模型在去标识化的医院报告上进行了微调,以便更好地把握专业术语与模式。研究比较了不同语言模型生成的文本特征对复发预测的表现。表现最突出的为专门针对医学内容优化的 MedGemma。当其文本特征与结构化数据分支融合后,得到的“MedGemma‑Fusion”模型显示出显著的准确性,在训练集、验证集和独立测试医院中的受试者工作特征曲线下面积均超过0.90。这意味着模型能够可靠地区分将保持无心律失常与将发生复发的患者。
窥视人工智能的“黑箱”
为了理解模型在做出预测时实际依赖的因素,研究者使用了解释性工具来估计每个输入的影响。在结构化数据中,常见的临床因素如患者房颤病程长短、左心房大小以及心律是间歇性还是持续性,对预测贡献最大。在文本方面,与消融过程相关的关键概念——例如肺静脉和电位的描述——排名靠前,反映了这些步骤对成功治疗的核心作用。超声报告中与心脏运动相关的术语也很重要,这与房颤导致的长期损伤在心房运动上体现一致。相比之下,24小时心电监测摘要的贡献相对较小,可能因为许多间歇性房颤患者在短时间监测中出现正常节律。

从研究模型走向床旁决策
除了原始准确性外,团队还通过生存分析检验了该工具将患者分为高风险和低风险组的能力。被 MedGemma‑Fusion 标记为高风险的患者在随访期间确实表现出更高的复发率。决策曲线分析表明,在许多合理阈值下,使用该模型来指导护理相比依赖传统评分或单一测量能够带来更大的净获益。尽管如此,作者强调若干重要限制:这是一项回顾性研究,样本量虽对单个项目而言较大,但对于深度学习仍属有限,而且各医院的报告风格存在差异。需要对更先进的大型语言模型进行迭代,并在其他卫生系统中进行更广泛的测试,方能将此类工具常规化。不过,这项工作说明了如何将病历中的日常数值与叙述性报告中的细微信息结合起来以提高预测能力,并可能最终帮助为房颤患者定制随访频率与治疗强度。
引用: Jia, S., Yin, Y., Guan, Y. et al. A deep learning model integrating structured data and clinical text for predicting atrial fibrillation recurrence. npj Digit. Med. 9, 253 (2026). https://doi.org/10.1038/s41746-026-02436-5
关键词: 房颤, 导管消融, 深度学习, 临床文本挖掘, 风险预测