Clear Sky Science · zh
基于多任务学习的抗生素耐药早期预测模型——基于多机构队列数据
这对日常医疗为何重要
抗生素耐药性正在悄然将曾经可治愈的感染变为危及生命的疾病。医生常常必须在实验室检测出哪种药物有效之前就选择抗生素,而检测结果可能需要几天时间。本研究探讨了如何利用训练于医院病历的计算模型,提前提示哪些抗生素可能失效,从而帮助保护患者并减缓耐药细菌的传播。
抗生素面临的压力
现代医学在从常规手术到癌症治疗等各方面高度依赖抗生素。然而细菌进化迅速,新抗生素出现的速度赶不上旧药失效的速度。本研究所在的韩国,在医院中多达三分之一的抗生素处方被认为不恰当。能揭示病原体是否耐药的培养检测通常需要三到五天,迫使医生在不完全信息下治疗。研究人员试图仅用患者住院早期可得的信息来预测对九大类抗生素的耐药性。

将医院数据转化为早期预警
研究团队分析了三家大型韩国医院中超过十年间59,551名成年患者的电子病历。这些记录包括年龄、生命体征、住院时长、既往抗生素使用情况,以及关键的既往培养检测结果——显示哪些抗生素已失效。研究者没有为每类抗生素训练九个独立模型,而是采用一种称为多任务学习的策略,使单一模型可以同时学习多个相关的预测任务。研究测试了两种版本:一种是具有共享核心并分支到各抗生素输出的硬共享模型,另一种是任务之间关联较松的软共享模型。
解决不完整化验结果的问题
真实医院数据通常很混乱:并非每位患者都对每种抗生素做了检测。先前的研究常将这些部分标注的病例剔除,导致数据集缩小并忽视跨药物的模式。在本研究中,研究人员改写了模型的学习规则,使其在计算训练误差时简单地跳过缺失的化验结果。这使得他们几乎可以保留所有患者参与分析,即便某些抗生素结果缺失。硬共享模型特别受益于此,因为它既能学习耐药的共同信号,又能针对每个药物组微调预测。
模型表现如何?
在对未见过的医院数据进行测试时,多任务模型整体上优于更传统的方法,如逻辑回归和标准提升算法。平均而言,硬共享模型在九类抗生素中表现出最佳的准确性与稳定性平衡,并且在数据最稀缺的药物组(例如氨基糖苷类)上表现尤为强劲。一项解释性分析显示,患者既往对某抗生素的耐药性是影响预测的最重要单一因素,其次是相关药物的耐药或使用情况,以及年龄和住院时长。子组分析表明,当某抗生素有既往培养结果时硬共享效果最好,而在缺乏此类历史时软共享更为有利。

这对患者和临床医师意味着什么
研究表明,合理利用医院记录可以在多种主要药物家族范围内提供早期且相对可靠的耐药性预测。即便是预测准确性的适度提升,应用于大量患者,也能帮助医生更早地选择更窄谱、更有针对性的抗生素,并更有信心地从广谱药物退阶。这反过来可能减少并发症、缩短住院时间并减缓耐药性的扩散。作者也提醒,他们的模型仍需在现实世界中进行测试和改进,尤其在缺乏既往培养数据时,但他们认为多任务学习为更好利用不完善的医疗数据并支持更谨慎的抗生素使用提供了有希望的途径。
引用: Kim, Y., Jeong, I., Park, JH. et al. Multi task learning based early prediction model for antibiotic resistance using multi institutional cohort data. Sci Rep 16, 11891 (2026). https://doi.org/10.1038/s41598-026-41185-z
关键词: 抗生素耐药性, 临床决策支持, 电子健康记录, 机器学习, 多任务学习