Clear Sky Science · zh

使用可解释的机器学习与综合数据预测卒中后功能结局

2026-04-15 · 返回目录

为什么卒中康复难以预测

缺血性卒中后，有些人在数月内就能恢复行走，而另一些人则面临长期残疾。家庭和医生希望尽早知道谁有望康复、谁可能需要更多支持。本研究探讨是否可以将现代计算方法与详细的血液检测结合起来，预测工作年龄卒中患者在卒中后三个月的功能状态——以及哪些信息对这些预测最为重要。

聚焦较年轻的卒中患者

研究者利用了一项长期进行的瑞典队列研究，跟踪了600名在18至69岁之间发生首次缺血性卒中的成年人，这些病例发生在当今溶栓等常规治疗普及之前。在这组人中，有506名患者具备完整数据且未在早期复发。医生记录了标准的临床信息——如年龄、卒中严重程度和病史——并在卒中几天后采集了血样。在这些样本中，他们不仅测量了常规实验室值，还测定了一整套与凝血、炎症、免疫活动和脑损伤相关的蛋白质。三个月后，神经科医生使用标准的卒中量表评估每个人的日常功能能力，并将其分为预后良好或不良两组。

教计算机识别康复模式

为了评估不同计算模型预测结局的能力，研究团队比较了四种方法：两种形式的正则化逻辑回归（传统统计学工具）、一种名为XGBoost的决策树集成以及一种简单的神经网络——多层感知器。在训练这些模型之前，他们仔细处理了缺失数据、对所有测量值进行了标准化，并采用特征选择方法（Boruta）聚焦最有信息量的变量。随后通过重复交叉验证评估模型表现，反复在大部分数据上训练模型并在剩余数据上测试。四种方法均达到了非常相似且较高的准确度，性能指标表明它们能够可靠地区分预后良好与不良的患者。

哪些特征最重要

除了准确性，更关键的问题是：哪些输入推动了这些预测？为此，研究者采用了一种可解释的人工智能方法——SAGE，用以估计每个特征对整体模型性能的贡献。在所有模型中，有一个因素明显领先：发病首周的神经学症状严重程度，以卒中严重度评分概括。症状越严重的患者更可能预后不良。但血液标志物提供了重要的补充信息。来源于大脑的tau蛋白（在神经细胞受损时释放）成为最有信息量的单一血液标志物。若干与炎症相关的蛋白——例如oncostatin M和白细胞介素‑6——也有贡献，尽管程度较小，这表明身体的免疫与凝血反应包含关于康复的额外线索。

在复杂模型与现实应用之间取得平衡

更灵活的模型，尤其是神经网络和XGBoost，往往更擅长正确识别那些会出现不良结局的患者，尽管有时代价是更多的误报。这一模式提示，临床与血液数据之间一些微妙的非线性组合具有额外的预测能力，是简单线性模型可能忽视的。同时，线性模型在繁忙的临床环境中仍更易于理解和实施。作者认为，将此类预测工具与透明的解释方法配对，能帮助临床医生建立信任并加以改进；未来需要在更大且更具多样性的患者群体中开展研究——包括接受现代卒中治疗的患者——以确认这些发现的广泛适用性。

这对患者和护理团队的意义

对脑卒中康复者而言，本研究强化了一个核心信息：早期卒中严重程度仍然决定大部分结局，但可反映直接脑损伤和炎症的血液检测可以使评估更为精确。从实用角度看，将床边评估与一套血液生物标志物和可解释的机器学习模型结合，未来可能提供更个性化的康复预后预测。这反过来有助于调整康复强度、规划家庭和工作支持，并为针对长期残疾高风险人群的临床试验设计提供依据。

引用: Olsson, J., Stanne, T.M., Andersson, B. et al. Predicting post-stroke functional outcome using explainable machine learning and integrated data. Sci Rep 16, 12462 (2026). https://doi.org/10.1038/s41598-026-47814-x

关键词: 缺血性卒中, 机器学习, 预后, 血液生物标志物, 来源于大脑的tau蛋白