Clear Sky Science · zh

基于系统综述的综合成熟度模型推动医疗人工智能治理进展

· 返回目录

为何更聪明的医疗 AI 规则至关重要

各大医院正竞相采用人工智能以更早发现疾病、减少文书工作并提高护理效率。但如果这些工具在选择或管理上存在缺陷,它们可能会悄然出错、加剧不平等或浪费宝贵资源。本文解释了一组研究人员如何梳理数十份现有的医疗 AI 指南,并构建出一条实用路线图,任何医疗机构——从小型门诊到顶级研究医院——都可以据此将 AI 安全、公平地投入使用。

厘清纷繁建议背后的脉络

近年来,全球专家提出了针对医疗领域 AI 使用的清单、指南和监督框架。作者对 2019 至 2024 年间发布的 35 份此类框架进行了系统评审,筛选出 29 份提供具体、多步骤指导的文件(而非仅聚焦于伦理等单一问题)。他们发现,虽然许多文献涵盖了如何开发算法或长期监测模型,但较少讨论组织层面的现实问题:谁应当负责?医院应如何在竞争产品间做出选择?资源匮乏的卫生系统如何跟上步伐?这些建议常以大型学术中心为目标而撰写,导致较小机构缺乏明确的前进路径。

Figure 1
Figure 1.

良好 AI 监管的七个构件

通过综述,研究者提炼出将 AI 负责任地融入患者护理所需覆盖的七大关键领域。这些包括:建立明确的领导架构、在动用技术前谨慎界定临床问题、理解算法的构建与训练方式、在采购前审查外部产品、测试工具在本地患者人群中的效果、将其合理嵌入日常临床工作流程,以及在上线后持续追踪其表现。文献中普遍强调诸如问题表述、模型开发和持续监测等任务,但作者注意到对评估外部产品以及设计能代表临床人员、技术专家、患者和法律与伦理专业人士观点的治理机构的论述较为薄弱。

从理论到分阶段路线图

为将分散的建议转化为更可用的工具,该团队创建了“医疗 AI 治理准备度评估”(Healthcare AI Governance Readiness Assessment,简称 HAIRA)——一个五级的“成熟度模型”,描述了随复杂度增加所应具备的治理能力。在第一级,组织仅有基本认知,主要依赖供应商对现成工具的保证,内部测试或整合最少。到第二级,出现了书面流程、简单的监督委员会、更有结构的工具选择流程和基本的性能监测。第三级描述了可独立验证模型、评估偏差等风险、将 AI 与质量改进项目整合并在工具进入临床实践时系统化管理变革的区域或社区级系统。

迈向高级与领先实践

第四和第五级体现了作者所称的高级与领先治理实践。第四级通常见于大型学术医疗中心:组织有专职的 AI 行政领导、健全的伦理结构、先进的数据基础设施以及强大的内部开发与评估能力,包括实时监测。第五级代表不仅能良好管理 AI,且能参与制定行业标准的机构。这类组织开展多中心研究以证明安全性与益处、尝试新型 AI 应用,并通过卓越中心与合作分享经验。重要的是,该模型采用“最薄弱环节”规则:组织的整体级别受制于七个领域中最不发达的那一项,反映出单一缺失的防护(例如监测薄弱)就能削弱其他方面的复杂努力。

Figure 2
Figure 2.

这对患者与提供者意味着什么

对患者而言,HAIRA 模型旨在确保 AI 工具以真正改善护理、而非带来隐性风险的方式被引入。对临床医生和卫生系统领导者而言,它提供了一条现实可行的阶梯:小型诊所可以先以记录如何选择与检查供应商工具、达到第二级为目标;较大的系统则可通过投资数据团队、公平评估方法与持续监测来争取更高等级。作者强调,并非每家医院都需要最尖端的能力,但所有机构都应达到基本的安全、公平与问责标准。通过将治理期望与可用资源相匹配,其框架旨在使值得信赖的医疗 AI 在多样化的医疗环境中可实现,而不仅限于资金最充足的机构。

引用: Hussein, R., Zink, A., Ramadan, B. et al. Advancing healthcare AI governance through a comprehensive maturity model based on systematic review. npj Digit. Med. 9, 236 (2026). https://doi.org/10.1038/s41746-026-02418-7

关键词: 医疗人工智能, 人工智能治理, 临床决策支持, 数字健康政策, 算法公平性