Clear Sky Science · zh
在真实世界ICU队列中使用机器学习对急性加慢性肝功能衰竭患者进行无偏分群
这对肝病患者为何重要
当长期肝病患者突然病情危重时,医生需要迅速判断谁死亡风险最高、谁有望恢复。当前这些决策多依赖专家意见和规模较小的研究构建的评分系统。本文展示了数据驱动的机器学习方法如何在真实世界的重症监护病房(ICU)急性加慢性肝功能衰竭患者中揭示潜在模式,可能指向更简单、更准确的方式来识别最需要积极救治的患者。
在没有先入为主假设下对重症患者进行分组
研究者分析了1,256例符合北美标准的ICU急性加慢性肝功能衰竭患者,该定义侧重脑、肺、心血管和肾功能衰竭。研究不是从既有的肝病评分出发,而是将50项常规测量的临床和化验值输入一种名为非负矩阵分解(NMF)的无监督机器学习方法。该技术在不事先告知哪些特征重要或预期有多少患者类型的情况下寻找数据中的自然分组。研究还使用了单独的算法来测试不同解并决定最合适的聚类数。

两个截然不同结局的清晰群体
在多种聚类方法变体中,数据一致地最适合分为仅两个患者组。获胜模型(称为Lee算法)产生了高度稳定的簇:即使多次重复运行,患者通常仍被归为同一组。作者比较生存情况时发现显著差异:一组30天死亡率约为70%,另一组约为26%。这种简单的二簇方案比传统的按器官衰竭数目计数的方法更能预测死亡率,尽管两组内都包含器官衰竭类型混杂的患者。
血液化学和代谢是关键信号
为了解释区分簇的原因,团队检查了哪些测量值对分组推动作用最大。若干与危重病相关的熟悉指标(如需要升压药、血乳酸水平和肌酐——肾功能指标)都很重要。但一个特别显著的发现是血液酸–碱平衡的测量——碳酸氢根、pH、碱剩余、乳酸和阴离子间隙——位列主要贡献者之中。高风险簇倾向于有更严重的酸碱紊乱:更低的pH和碳酸氢根、更大的碱亏和更高的阴离子间隙,符合广泛代谢应激和组织缺氧的情况。这些模式提示,机体维持化学平衡的能力可能与哪些器官衰竭一样重要。

在其他患者群体中检验这一模式
由于ICU数据来自单一卫生系统并采用一种急性加慢性肝功能衰竭的定义,作者检验了这些发现是否在其他环境中成立。他们将相同模型应用于符合欧洲定义的患者以及更广泛的失代偿性肝硬化ICU患者群体,其中许多人并不正式符合急性加慢性肝功能衰竭。在这两种情况下,聚类再次将患者分为两个组,30天死亡率差距同样显著,且与酸碱相关的变量仍处于核心地位。来自多家美国医院的独立ICU数据库(尽管缺乏长期结局数据)也显示相同的二簇结构和重叠的关键变量,支持该方法的稳健性。
这对未来护理的可能意义
该研究尚未提供能直接改善生存率的床旁工具,且存在局限性,包括聚焦于病情极重的ICU患者和依赖回顾性数据。但它提供了概念验证:无偏、数据驱动的方法可以在长期难以简单分类的复杂疾病中揭示临床有意义的亚型。对患者和家属来说,主要信息是血液中的酸碱平衡——医生已常规测量的指标——可能为严重肝危象的风险和恢复提供有力线索。通过进一步研究和前瞻性验证,此类聚类模型或可帮助临床医生更早识别最脆弱的患者,并设计针对驱动不良结局的代谢紊乱的治疗方案。
引用: Zhang, M., Ji, F., Zu, J. et al. Unbiased clustering of acute-on-chronic liver failure patients using machine learning in a real-world ICU cohort. Nat Commun 17, 1670 (2026). https://doi.org/10.1038/s41467-026-68368-6
关键词: 急性加慢性肝功能衰竭, 机器学习, ICU 结局, 酸碱平衡, 肝硬化