Clear Sky Science · zh

机器学习在结肠癌治疗结局预测中的应用

· 返回目录

为何预测结肠癌结局很重要

结肠癌是全球最常见的癌症之一,许多患者和家庭都想知道一个简单而迫切的问题:“我的存活概率是多少,还有什么可以改善?” 这项来自伊朗的研究探讨了现代计算技术(称为机器学习)如何从详尽的病历中筛选信息,更好地预测哪些患者在手术后风险更高。通过提高预测的准确性,医生或能更精确地为患者量身定制治疗和随访计划,从而给弱势患者更好的长期生存机会。

将医院记录转化为有用模式

研究者利用了来自伊朗设拉子的一个大型中心、10 年间 764 名接受结肠癌手术患者的数据。每位患者收集了 44 项信息,包括年龄、血液检查、肿瘤大小、癌期、症状以及手术和化疗等治疗细节。研究团队对这些记录进行了清洗和核查:纠正不可能的化验值、剔除无法随访的患者,并用合理估计填补缺失项。随后他们将数据拆分,绝大部分用于训练计算模型,另一部分则保留用于测试这些模型在预测随访时患者生存或死亡方面的表现。

Figure 1
Figure 1.

智能算法如何从患者中学习

研究并未仅依赖传统统计方法,而是将几种现代计算方法并列比较。这些方法包括不同的“森林(forest)”和“提升(boosting)”算法,它们通过组合许多简单决策规则来工作,还有近似模拟脑细胞连接方式的神经网络。各种方法的目标一致:利用患者信息去预测每个人是否存活,然后将这些预测与实际结果对比。模型以总体正确率、识别已死亡患者的能力(敏感性)以及避免对存活患者发出虚假警报的能力(特异性)来评判。表现最佳的方法总体准确率约为 80%,考虑到癌症结局的复杂性,这是一个相当强的结果。

哪些模型和因素最重要

在所有方法中,一种称为 CatBoost 的方法提供了最高的总体准确率,而随机森林模型在正确标识高危患者与避免对良好患者过度警示之间表现出最佳平衡。为了让结果更易为医生理解,团队使用了一种解释工具,对影响计算决策的各项信息进行排序。癌症分期——对肿瘤大小、是否累及淋巴结及是否发生远处转移的综合描述——是影响最大的单一因素。肿瘤大小、肿瘤侵袭结肠壁的深度、是否有远处器官转移、治疗方式、肿瘤分级(细胞异常程度)、淋巴及血管受累情况、患者年龄以及体重下降等也在生存预测中起重要作用。

Figure 2
Figure 2.

从数据到床边决策

这些发现表明,经过谨慎训练的计算模型,输入常规临床信息后,可以帮助医生识别那些在结肠癌手术后风险隐匿上升的患者。在日常临床中,这样的工具可以集成到电子健康记录中,瞬时将患者肿瘤和整体健康状况的细节合成为一个简单的风险估计。该数值不会取代医生的判断,但可以指导例如随访频率、额外治疗是否值得承担副作用,或何时需要第二意见等决策。由于计算机识别出的最重要因素与癌症专家已认为关键的因素一致,该系统更容易获得信任并向患者解释。

这对患者和未来意味着什么

对患者和家庭来说,核心信息是:计算机现在可以利用常规医疗数据来支持更个性化的结肠癌护理。虽然这项研究是在伊朗的单一中心完成的,仍需在其他医院以及纳入更丰富数据(如基因和影像信息)的情况下进一步验证,但它表明机器学习可以突出显示谁需要额外关注以及原因。随着更多数据的加入和模型的不断改进,这些工具有望帮助全球的医生提供不仅基于证据,而且更为精细地针对每位患者具体癌情和情况的治疗。

引用: Ghasemi, H., Hosseini, S.V., Rezaianzadeh, A. et al. Machine learning application in colon cancer treatment outcome prediction. Sci Rep 16, 6159 (2026). https://doi.org/10.1038/s41598-026-36917-0

关键词: 结肠癌, 机器学习, 治疗结局, 风险预测, 临床数据