Clear Sky Science · zh

医疗领域的人工智能代理:应用、评估与未来方向

· 返回目录

为什么智能数字助手在医学中很重要

医院被数据淹没、医生负荷过重,患者则希望获得更清晰的健康答案。一种新的人工智能形式,基于能够像人类一样阅读与书写的大语言模型,如今被开发成可以推理多步任务的“AI代理”。这篇综述文章解释了这些数字助手如何开始在诊断、治疗决策、文书工作、患者交流乃至医学教育中提供帮助——同时也提醒为保证其准确、公平与安全必须采取的措施。

Figure 1
Figure 1.

从思想实验到实际的数字同事

具有目标与意向并能采取行动的“代理”这一构想可追溯至古代哲学。现代版本随早期人工智能、专家系统以及后来的机器学习和深度学习而来,这些方法使计算机能够从数据中学习模式。2022年以后的大语言模型(LLM)突破将事态推动得更远:这些模型不仅能回答问题,还能规划、记忆先前步骤并调用其他软件工具。在医疗领域,这意味着AI代理可以阅读病历、查阅指南、起草病程记录并建议下一步行动,它的行为更像是一个初级的数字同事,而非单纯的搜索引擎。

这些代理与普通AI有何不同

根据文章采用的定义,医疗中的AI代理不仅仅是单一模型。它以大语言模型为核心,周围具备四项关键能力:规划、记忆、工具使用与自我反思。规划使其能将复杂的医疗任务拆分为更小的步骤。记忆让它能跟踪患者的病史或冗长的决策过程。工具使用意味着它可以例如从电子病历中提取化验结果或检索医学数据库。自我反思模块用于检查并修正自身答案。再加上强大的语言能力与日益增强的逻辑推理能力,这些特性使代理足够灵活,能够在不同任务和医学专科间切换。

Figure 2
Figure 2.

AI代理在真实医疗工作中的测试方式

研究人员目前正在构建和模拟多种类型的代理,以评估它们在哪些场景中最有用。有些代理旨在通过模拟虚拟医生与患者的对话来支持诊断,或由多个专科代理对疑难病例进行辩论。另一些则专注于治疗决策,整合来自全科医生、专科医生和药师的输入以达成共同方案。有的代理能根据胸片起草放射学报告,或将技术性发现翻译成通俗、患者友好的语言。类聊天机器人的系统正被试点用于心理健康支持、减重指导和服药提醒。还有代理帮助管理处方、发现药物副作用、简化电子病历流程,或通过真实感的模拟患者训练医学生。

评判这些系统是否可用于患者

鉴于医疗错误可能危及生命,本文综述认为对AI代理的评估必须超越所谓的聪明程度。作者将测试分为两层。基础检查询问:答案是否符合事实?措辞是否与专家报告一致?代理是否可靠地完成任务,包括调用正确的工具?面向开发的检查关注速度、清晰度以及系统与人的沟通质量,包括尊重、同理心以及对不同患者群体的公平性。研究将代理与其他顶级语言模型以及人类医生进行比较,欧洲、英国、中国等地的监管机构也开始设计官方“沙箱”项目,以在部署前测试安全性、公平性和临床效益。

下一步:机器人、规则与公众信任

展望未来,文章强调了七项优先任务:将代理连接到能在现实世界行动的物理机器人;将通用模型与更小的专科模型结合;将评估扩展到成本、安全事件和患者满意度;建立更强的保障与监管;嵌入伦理与隐私保护;在设计上重视用户信任与持续反馈;以及帮助医务人员调整职业以便与AI并肩工作而非被取代。作者总结认为,AI代理有可能成为医疗领域的强大伙伴,但前提是它们在开发、测试与治理方面必须像社会对任何新医疗技术所要求的那样谨慎对待。

引用: Zhao, L., Liu, S., Xin, T. et al. AI agent in healthcare: applications, evaluations, and future directions. npj Artif. Intell. 2, 31 (2026). https://doi.org/10.1038/s44387-026-00076-4

关键词: 医疗中的人工智能代理, 大语言模型, 临床决策支持, 医疗聊天机器人, 数字健康