Clear Sky Science · zh
使用双层嵌入与三层可解释性的智能 MDT III 期非小细胞肺癌治疗决策
为复杂的肺癌选择提供更聪明的帮助
对于被诊断为晚期肺癌的人来说,治疗选择可能令人眼花缭乱——通常涉及手术、放疗、化疗、免疫治疗或这些方法的组合。理想情况下,一个被称为多学科团队(MDT)的专家小组会评估每例病例并制定个体化方案。但在许多医院,尤其是资源有限的地方,大多数患者无法获得这种水平的关注。本研究描述了一种人工智能(AI)系统,旨在模仿并解释此类专家团队的推理,目标是将 MDT 级别的建议推广到更多患者身上。
为什么治疗决策如此困难
非小细胞肺癌(NSCLC)是全球最常见的肺癌类型,约三分之一的患者在首次诊断时已处于 III 期。在这一阶段,肿瘤和淋巴结的受累情况各不相同,使每位患者的病情模式独一无二。因此,没有简单的一刀切治疗路径。MDT 将外科医生、肿瘤科医生、影像科医生及其他专家聚集在一起,权衡病历中的所有细节并达成治疗方案。研究表明,这种团队式的方法可以改善生存率和生活质量,但 MDT 会议耗时且依赖稀缺的专家资源,因此在实践中只有少数患者能受益。
把病历变成可学习的模式
为弥合这一差距,研究团队构建了一个从已接受 MDT 审核的病例中学习并为新患者提供建议的 AI 模型。他们收集了中国两家大型医院中 2,876 名 III 期 NSCLC 患者的电子病历(EMR)。在这些病例中,他们重点关注了 2,521 名其治疗可归入六类常见方案的患者,例如手术、放化疗或化疗联合免疫治疗或靶向药物等。系统并不依赖少数人工挑选的变量,而是读取丰富的自由文本病程记录,描述影像、化验、症状和临床印象,并结合年龄和分期等基本信息。 
看词与句,而不仅仅是数字
该方法的核心在于如何将文本转化为计算机可以推理的形式。模型采用“二级嵌入”策略:既在词层面表示细节,又捕捉整句的广义含义。对于词,模型使用了针对中文医学文本微调的语言模型,并借助医学知识图谱增强,后者编码了疾病、药物、症状和操作之间的关系。对于句子,使用另一个模型来学习哪些句子在语义上更为相关。一个注意力机制随后学习如何权衡并结合这两种视角,生成每位患者病历的紧凑摘要,该摘要输入到神经网络分类器中以预测 MDT 可能选择的六种治疗方案中的哪一种。
让 AI 的推理可见
由于医生必须能够信任并质询算法建议,团队将系统设计为具备三层可解释性:词、短语和句子层。注意力得分会突出病历中对推荐影响最大的词和句子——例如对肿瘤扩散、淋巴结受累或关键生物标志物的描述。一种称为注意力流的技术追踪模型各层中词组如何组合成有意义的短语,例如指示支持手术的证据或相反倾向药物治疗的证据。这些多层解释使临床医生能够查看 AI 的关注点是否与他们对病例的解读一致,而不是接收一个“黑箱”答案。 
从预测到真实世界的生存结果
在经过 MDT 审核的病例上,模型在准确率、精确率、召回率和 F1 分数方面均超过 85%,表明其建议的治疗与专家决策高度一致。研究人员随后考察了那些从未接受 MDT 咨询的患者的结局。他们将每例实际给出的治疗标注为“与模型一致”(model-concordant)或“与模型不一致”(model-nonconcordant)。处于模型一致组的患者生存率明显更好,在一年、三年和五年生存率上更高,Kaplan–Meier 生存曲线也明显分离。即便在调整了年龄、性别、疾病分期以及肿瘤是新诊断还是复发等因素后,接受与模型一致的治疗仍与显著降低的死亡风险相关。
这对患者可能意味着什么
简而言之,AI 系统学会了模仿多学科专家的选择,并指出驱动这些选择的病历关键信息。对于那些无法对每例病例都召开完整 MDT 会议的医院,这类工具可作为一种可扩展的第二意见:突出患者特异的细节、建议可能的最佳治疗并标记需要更深入团队评审的病例。尽管该研究仅限于两家中心的 III 期 NSCLC,并需更广泛的验证,但它表明经过精心设计且可解释的 AI 有望将专家级的决策支持带给更多面对复杂癌症治疗的人群。
引用: Chen, Z., Chai, N., Wang, J. et al. Intelligent MDT treatment decision making for stage III NSCLC using dual level embedding and three level explanation. Sci Rep 16, 7807 (2026). https://doi.org/10.1038/s41598-026-39658-2
关键词: 肺癌, 治疗建议, 多学科团队, 医疗人工智能, 生存结局