Clear Sky Science · zh

使用常规生物标志物的可解释机器学习识别培养确诊的菌血性尿源性败血症

· 返回目录

这为何与日常健康相关

大多数人认为尿路感染是一种痛苦但简单的问题。然而在部分患者中,细菌会从泌尿道进入血流,引发一种危险的全身反应——尿源性败血症,可能导致器官衰竭乃至死亡。医生需要尽早识别哪些患者正朝这一严重状态发展,但目前床边工具与缓慢的培养检测常常留下一个高风险的盲点。本研究探讨了是否可以仅用常见的血液检测结果,结合可解释的机器学习方法,在住院后第一天内标记出这些高危患者。

Figure 1
Figure 1.

从常见感染到危及生命的疾病

尿路感染是全球最常见的细菌性感染之一。其中一小部分病例会进展为尿源性败血症,此时机体对感染的反应变得广泛且具有破坏性。早期阶段,常规尿路感染患者与即将发生尿源性败血症的患者可能表现非常相似:他们可能出现发热、疼痛和异常化验结果,但尚未出现标准败血症评分所捕捉到的明确器官功能衰竭迹象。血培养——用于证明细菌已进入血液——可能需要几天才能阳性。因此,作者关注一个实用问题:我们能否仅使用在最初24小时内常规采集的化验结果,来检测哪些住院的尿路感染患者已经有血流感染?

以真实世界医院数据构建研究

研究团队分析了来自单一医院的182名住院患者记录,这些患者被怀疑有尿路感染且同时进行了尿培养和血培养。所有患者的尿培养均证实存在感染。随后将他们分为两组:89名“菌血性尿源性败血症”患者,即血液和尿液中发现相同细菌;以及93名感染局限于泌尿道、血培养保持阴性的患者。对每位患者,研究者收集了在首次培养下单命令后24小时内采集的常规化验结果——例如炎症标志、凝血指标、肾功能和蛋白质水平等。关键在于,他们仅使用在培养结果返回前可获得的信息,模拟临床医生在实时决策中面临的不确定性。

早期化验揭示的差异

多项血液指标在两组之间显示出显著差异。菌血性尿源性败血症患者往往具有更高的降钙素原和C反应蛋白水平,这两者均为强烈炎症的指标;同时白细胞计数、血糖、肌酐(肾脏压力的指标)和D-二聚体(血栓分解产物,提示凝血系统激活)也更高。与此同时,他们的白蛋白和总蛋白水平较低,提示循环通透性增加和整体储备较差,血小板和淋巴细胞计数也较低。单独看,这些检测中有些——尤其是降钙素原——在区分单纯尿路感染与血流感染方面已经表现良好,但没有任何一个指标是完美的。作者认为,将这些指标与现代算法结合可以捕捉更微妙的模式和相互作用。

Figure 2
Figure 2.

训练可解释的机器学习模型

为将这些分散的化验数值转化为实用的风险评分,研究者训练了三种不同的计算模型:传统逻辑回归,以及两种常用的基于决策树的机器学习方法——随机森林和XGBoost。他们随机保留约五分之一的患者作为隐藏测试集,在其余数据上训练模型,并小心避免任何未来信息泄露。在对未见过的测试患者进行评估时,随机森林和XGBoost都显示出“良好的判别力”,即它们会给菌血性尿源性败血症患者分配比仅限泌尿道感染患者更高的风险评分。总体上XGBoost取得了最高的准确性,但由于测试组规模有限,其相对于随机森林的数值优势并不具备统计学上的确定性。

打开预测的黑箱

机器学习在医学中的一个常见批评是其可能表现为黑箱。为了解决这一点,作者使用了一种称为SHAP(Shapley可加解释)的技术,展示每项化验如何对模型对每位患者的决策做出贡献。在这些解释中,D-二聚体、血小板计数、降钙素原、年龄、红细胞分布宽度、肌酐、白细胞和白蛋白成为最具影响力的特征。模型并非依赖单一的“魔法数值”,而是依靠组合——例如高凝血活性伴随强烈炎症和低白蛋白——来推动预测风险的升高或降低。这种透明性有助于临床医生评估模型推理是否符合医学理解,并可能增强将其作为床边辅助工具的信任度。

这对患者护理可能意味着什么

研究表明,一组简单的常规血液检测,通过可解释的机器学习模型解读,可能帮助医生在培养结果到达之前识别哪些尿路感染患者很可能存在血流中的细菌。在实践中,这样的评分可以在医院实验室或电子病历系统中自动运行,只要第一批化验结果可用,即提示加强监测、重复检查或对高风险患者更早调整抗生素治疗。不过,该工作有重要局限性:它来自单中心、患者数量相对较少,且聚焦于培养证实的血流感染,而不是包括培养阴性的所有败血症形式。作者强调,他们的模型是一个有前景的原型,尚未准备好用于常规临床,并且需要更大规模、多中心的研究来确认其性能及对结局的影响。

引用: Zhang, YL., Yu, DX., Zheng, YY. et al. Explainable machine learning with routine biomarkers identifies culture-defined bacteremic urosepsis. Sci Rep 16, 11982 (2026). https://doi.org/10.1038/s41598-026-42178-8

关键词: 尿源性败血症, 尿路感染, 败血症生物标志物, 医学中的机器学习, 早期感染检测