Clear Sky Science · zh

可信赖感知可解释人工智能框架(TAXAI):一种用于可解释且可靠的临床AI系统的定量模型

· 返回目录

当计算机帮助医生时,为什么信任很重要

各医院正转向使用人工智能来读取影像、早期发现疾病并指导治疗选择。然而,许多医生和患者对依赖无法完全透视的软件感到不安。本文提出了一种衡量我们应将多少信任置于医疗AI系统中的方法,而不仅仅是衡量其性能。通过将信任量化为一个数字,旨在帮助临床医生、监管者和开发者决定何时将AI工具投入真实医疗使用是安全且可靠的。

从黑箱到更清晰的推理

现代AI系统在解读医学影像和分析病人数据方面可以媲美甚至超越人类专家。但这些系统往往像黑箱,仅给出预测而没有清晰解释。现有的解释工具可以在X光片上绘制热图或列出哪些化验值影响了决策,但它们很少说明这些解释是否可靠、公平或随时间稳定。作者认为,仅仅展示模型行为在像诊断和癌症分期这样的高风险情境中并不足够;我们还需要证据表明这些解释本身是值得信赖的。

Figure 1. 医疗数据、人工智能与伦理如何结合为临床决策生成单一的信任评分
Figure 1. 医疗数据、人工智能与伦理如何结合为临床决策生成单一的信任评分

可信赖医疗AI的三大支柱

研究提出了可信赖感知可解释人工智能(TAXAI)框架,将信任视为三大支柱的组合。第一是保真性,指解释与底层模型实际行为的吻合程度。第二是可解释性对齐,用以检查突出显示的区域或特征是否与临床医生对病例的推理相符。第三支柱是合规性与可靠性,涵盖患者群体之间的公平性、在小幅变化下结果的稳定性,以及跨运行和场所复制结果的能力。每一支柱都在0到1的尺度上进行衡量,以便进行比较和组合。

把信任变成一个清晰的分数

TAXAI将这三种要素合并为单一的信任指数,一个介于0到1之间的数值。该指数通过为每一支柱赋予权重来计算,这些权重可以针对不同情境进行调整。例如,在模型早期开发阶段,可以更多地侧重于技术准确性,而监管机构可能更倾向于强调公平性和可靠性。作者证明了使用他们的公式时,信任指数保持在明确的边界之内,在任何组成部分改进或恶化时都有可预测的响应,并且在权重发生小幅变动时保持稳定。这使得在不同模型、数据集和解释方法之间比较信任水平更为容易。

Figure 2. 对准确性、临床医生一致性与公平性的独立检查如何合并为一个整体的信任信号
Figure 2. 对准确性、临床医生一致性与公平性的独立检查如何合并为一个整体的信任信号

在多种医疗任务上测试该框架

为了展示TAXAI的实际运行方式,作者将其应用于若干常见的医疗AI问题,包括从CT扫描检测肺癌、读取胸片以识别肺炎和COVID、在组织学图像中对肺组织分级、从表格化检测结果中对乳腺癌进行分类、在MRI图像中发现脑瘤,以及从临床记录预测糖尿病风险。对于每个任务,他们将常用的解释工具如SHAP、LIME和Grad-CAM附加到标准的机器学习和深度学习模型上。随后计算保真性、可解释性对齐和合规性得分,并将其汇总为信任指数。在这些设置中,信任指数通常介于0.85到0.94之间,表明该框架产生的是一致且可解释的信任分数,而非紊乱或仅依赖特定数据集的行为。

将算法与伦理和政策连接起来

该工作还将TAXAI置于更广泛的医疗监管背景中。欧盟等地区的新规以及美国食品药品监督管理局等机构的指导,要求对影响患者护理的AI保证透明性、公平性并进行持续监管。TAXAI被提出为位于现有模型和解释工具之上的一层,将它们的输出转化为可纳入审计、文档和临床治理的信任信号。作者强调,TAXAI并不试图取代现有的解释方法;相反,它提供了一种有结构的方法来评估一个可解释系统作为医疗软件的准备程度。

这对未来临床中的AI意味着什么

简言之,本文展示了如何像衡量准确性或速度等其他可测量质量一样对医疗AI中的信任进行度量。通过将信任分解为技术、人类和伦理三部分,然后将它们重新组合为一个清晰的指标,TAXAI为医院和监管机构提供了一个比较系统的共同尺度。尽管当前工作侧重于计算测试而非真实临床试验,但它为未来的工具奠定了基础,如信任仪表板和临床医生参与的研究。如果被采纳,这种方法可能有助于将医疗AI从令人印象深刻的展示转向可依赖、良好治理并且医生与患者更愿意信赖的工具。

引用: Pal, M., Saha, H.N. & Chakrabarti, A. The Trust-Aware XAI (TAXAI) framework: a quantitative model for interpretable and reliable clinical AI systems. Sci Rep 16, 15455 (2026). https://doi.org/10.1038/s41598-026-44167-3

关键词: 对医疗人工智能的信任, 可解释人工智能(医疗), 临床决策支持, 人工智能的公平性与可靠性, 信任指数框架