Clear Sky Science · zh
用于复杂心脏病护理的大型语言模型
为所有人带来更聪明的心脏护理
严重的心脏疾病通常需要高度专业化的医生,但许多人居住在远离大型医疗中心的地区或面临专家就诊的长时间等待。本研究提出了一个及时的问题:一种先进的人工智能语言系统能否帮助普通心脏科医生为患有罕见遗传性心脏病的患者做出更安全、更完整的决策——同时不取代人类医生?

缺乏心脏病专家的问题
遗传性心肌疾病,例如肥厚型心肌病,可能导致原本健康的年轻人猝死,但许多患者从未得到正确诊断。在美国超过一半的州,没有专门针对这些疾病的中心,全球范围内这一短缺问题更为严重。因此,患者可能在不同门诊间辗转,错过关键检查,或延误获得救命治疗。作者认为,如果普通心脏科医生能够通过按一下按钮安全地获得亚专科医生级别的知识,更多患者就能在就近地点、恰当时间获得正确的护理。
坐在心脏科医生办公桌旁的 AI 合作伙伴
研究团队评估了一种名为 Articulate Medical Intelligence Explorer(AMIE)的实验性系统,该系统构建于类似于先进聊天机器人的大型语言模型之上。与只使用简单文本描述不同,AMIE 接收的是来自真实患者心脏检查的详细报告——心电图、超声心动图、心脏磁共振成像、运动负荷试验和心律监测器。在一项随机试验中,九名普通心脏科医生各自审查了 107 例疑似遗传性心脏病的复杂病例。对于每位患者,一名心脏科医生单独工作,而另一名则可以查看 AMIE 的完整书面评估并与该人工智能对话,以完善诊断、分流决策和治疗计划。
专家评判结果
为了判断人工智能是否真正起到了帮助作用,三位亚专科心脏病医生在不知道报告来源的情况下,对每位患者成对的报告进行比较——一份来自单独工作的心脏科医生,另一份来自使用 AMIE 的心脏科医生。他们在多个方面对哪一份更可取进行评分,包括总体质量、推荐的检查与管理方案,并检查每份报告是否存在重要错误或信息缺失。在 107 例中,他们在近一半的情况下更倾向于 AMIE 协助的评估,大约三分之一时间偏好仅由心脏科医生完成的报告,其余被判断为不分胜负。关键是,使用 AI 支持的报告临床上重要错误的数量约为一半,且遗漏关键信息的情况显著减少。

一线医生的使用体验
使用 AMIE 的心脏科医生也就日常体验进行了调查。在多数病例中,他们认为 AI 提升了评估质量并增强了自信,并报告在大约一半的患者中节省了时间,有时将工作量减少超过 50%。AI 并非没有缺陷:医生注意到偶有“幻觉”现象,AMIE 会捏造或误读发现,还有些情况下它忽略信息或重复已经完成的检查。然而,这类问题相对少见,医生常通过质疑系统的陈述来使其自行纠正,这强调了人工监督的重要性。
前景、局限与下一步
这项试验表明,在细致谨慎的临床医生配合下,人工智能语言系统可以帮助使复杂的心脏护理更完整、在一定程度上更安全且更高效。它并未取代心脏科医生的判断,作者强调该技术尚无法独立工作,也不应在没有更多安全措施、更大规模研究及对偏差、成本和患者视角的密切关注下广泛部署。不过,对于居住在远离大型心脏中心或需等待数月才能见到专家的人群,这项工作指向了一个前景:通过经过充分测试的 AI 助手支持,当地医生能够提供更接近专家诊所水平的护理。
引用: O’Sullivan, J.W., Palepu, A., Saab, K. et al. A large language model for complex cardiology care. Nat Med 32, 616–623 (2026). https://doi.org/10.1038/s41591-025-04190-9
关键词: 心脏病学人工智能, 大型语言模型, 遗传性心脏病, 临床决策支持, 随机对照试验