Clear Sky Science · zh
使用机器学习模型和特征选择预测急性胰腺炎中的感染性胰腺坏死
这对患者和家庭为何重要
胰腺的严重炎症发作可能在器官部分组织坏死并继发感染时突然变得危及生命。医生对这一危险非常清楚,但在疾病的最初几天里,他们仍然难以判断哪些患者会走向这种并发症。本研究展示了经过精心设计的计算模型如何利用常规医院数据,帮助医生更早、更准确地估计这种风险,从而有可能在感染形成之前指导治疗决策。

常见急症中的隐匿危险
急性胰腺炎是全球最常见的消化系统急症之一。许多患者通过支持性治疗康复,但有相当一部分会出现严重问题,如胰腺及其周围的液体积聚和坏死区域。当这些坏死区域发生感染——称为感染性胰腺坏死时,器官衰竭、长期住院和死亡的风险显著上升。由于感染通常在入院几天后才出现,临床医生正在寻找利用入院最初几小时或几天可得信息来尽早识别高危患者的方法。
传统评分表与新的智能工具
医院已使用多种评分表来评估胰腺炎患者的病情,如APACHE II、BISAP以及基于CT的严重度指标。这些工具将生命体征、化验和影像学结果合并为一个分值。尽管有帮助,但它们并非专门为预测感染性坏死而设计,因此常常漏诊随后恶化的患者。相比之下,现代机器学习可以同时筛查更多变量,捕捉人类设计评分忽视的微妙模式和相互作用。以往研究将此类技术用于总体疾病严重度的预测,但很少专门针对坏死组织感染,且往往缺乏在独立患者组上的严格测试或对模型预测机制的清晰解释。
构建以数据为驱动的早期预警系统
作者分析了2017至2023年间某大型中国医院收治的728例首次发作急性胰腺炎成人病历数据,经剔除无早期影像或血液检测以及合并其他复杂病情的患者后纳入分析。大多数测量值—including 血常规、炎症与凝血指标及临床评分—均在入院24小时内采集,并且均于任何感染性坏死诊断之前采得。研究者训练了六种不同的预测模型,包括若干基于树的方法、神经网络和传统线性方法。为避免过拟合,他们采用严格的交叉验证策略:每个模型在数据的不同切片上反复训练与测试,同时自动选择最有信息量的特征。随后他们固定各模型的最佳版本,并在一组完全独立的、于2022–2023年入院的166名患者上进行了评估。

计算机对感染风险学到了什么
在各模型中,基于树的方法——尤其是随机森林——在预测谁会发展为感染性坏死方面表现出最强且最可靠的预测力。最佳的随机森林模型明显优于广泛使用的APACHE II评分,能更准确地区分高风险与低风险患者,且风险概率校准更好。为了解开“黑箱”,团队使用了一种称为SHAP的技术,将每位患者的预测分解到具体的输入特征。该分析突出了若干凝血与炎症的血液标志物——包括纤维蛋白原、D-二聚体、白细胞介素-6和C反应蛋白——以及APACHE II评分本身,作为强烈的预警信号。相比之下,较高的淋巴细胞计数和更健康的血液浓缩度与肾功能指标则表现为保护性因素。这些模式与现有医学知识相一致,说明严重炎症、血流紊乱与免疫受损如何为受损胰腺组织的感染创造条件。
从研究工具到床边支持
该研究表明,一种可解释的随机森林模型,基于医院已常规采集的化验与临床信息,可能作为感染性胰腺坏死的早期预警工具。此类系统并非要取代临床判断,而是可标识出可能需要更密切监测、重复影像学检查、提前转入重症监护或对抗生素与操作更为谨慎的患者。由于本研究来自单一转诊中心并依赖回顾性数据,仍需在多家医院和不同患者群体中进行验证和微调。如果后续研究成功,这类透明、以数据驱动的风险计算器有望成为急性胰腺炎住院患者日常护理的一部分,帮助医生在最关键时刻更早、更精确地采取行动。
引用: Xin, L., Yixuan, D., Bohan, H. et al. Predicting infected pancreatic necrosis in acute pancreatitis using machine learning models and feature selection. Sci Rep 16, 11338 (2026). https://doi.org/10.1038/s41598-026-38410-0
关键词: 急性胰腺炎, 感染性胰腺坏死, 机器学习, 临床风险预测, 随机森林