Clear Sky Science · zh

使用可解释的机器学习与综合数据预测卒中后功能结局

· 返回目录

为什么卒中康复难以预测

缺血性卒中后,有些人在数月内就能恢复行走,而另一些人则面临长期残疾。家庭和医生希望尽早知道谁有望康复、谁可能需要更多支持。本研究探讨是否可以将现代计算方法与详细的血液检测结合起来,预测工作年龄卒中患者在卒中后三个月的功能状态——以及哪些信息对这些预测最为重要。

聚焦较年轻的卒中患者

研究者利用了一项长期进行的瑞典队列研究,跟踪了600名在18至69岁之间发生首次缺血性卒中的成年人,这些病例发生在当今溶栓等常规治疗普及之前。在这组人中,有506名患者具备完整数据且未在早期复发。医生记录了标准的临床信息——如年龄、卒中严重程度和病史——并在卒中几天后采集了血样。在这些样本中,他们不仅测量了常规实验室值,还测定了一整套与凝血、炎症、免疫活动和脑损伤相关的蛋白质。三个月后,神经科医生使用标准的卒中量表评估每个人的日常功能能力,并将其分为预后良好或不良两组。

Figure 1
Figure 1.

教计算机识别康复模式

为了评估不同计算模型预测结局的能力,研究团队比较了四种方法:两种形式的正则化逻辑回归(传统统计学工具)、一种名为XGBoost的决策树集成以及一种简单的神经网络——多层感知器。在训练这些模型之前,他们仔细处理了缺失数据、对所有测量值进行了标准化,并采用特征选择方法(Boruta)聚焦最有信息量的变量。随后通过重复交叉验证评估模型表现,反复在大部分数据上训练模型并在剩余数据上测试。四种方法均达到了非常相似且较高的准确度,性能指标表明它们能够可靠地区分预后良好与不良的患者。

哪些特征最重要

除了准确性,更关键的问题是:哪些输入推动了这些预测?为此,研究者采用了一种可解释的人工智能方法——SAGE,用以估计每个特征对整体模型性能的贡献。在所有模型中,有一个因素明显领先:发病首周的神经学症状严重程度,以卒中严重度评分概括。症状越严重的患者更可能预后不良。但血液标志物提供了重要的补充信息。来源于大脑的tau蛋白(在神经细胞受损时释放)成为最有信息量的单一血液标志物。若干与炎症相关的蛋白——例如oncostatin M和白细胞介素‑6——也有贡献,尽管程度较小,这表明身体的免疫与凝血反应包含关于康复的额外线索。

Figure 2
Figure 2.

在复杂模型与现实应用之间取得平衡

更灵活的模型,尤其是神经网络和XGBoost,往往更擅长正确识别那些会出现不良结局的患者,尽管有时代价是更多的误报。这一模式提示,临床与血液数据之间一些微妙的非线性组合具有额外的预测能力,是简单线性模型可能忽视的。同时,线性模型在繁忙的临床环境中仍更易于理解和实施。作者认为,将此类预测工具与透明的解释方法配对,能帮助临床医生建立信任并加以改进;未来需要在更大且更具多样性的患者群体中开展研究——包括接受现代卒中治疗的患者——以确认这些发现的广泛适用性。

这对患者和护理团队的意义

对脑卒中康复者而言,本研究强化了一个核心信息:早期卒中严重程度仍然决定大部分结局,但可反映直接脑损伤和炎症的血液检测可以使评估更为精确。从实用角度看,将床边评估与一套血液生物标志物和可解释的机器学习模型结合,未来可能提供更个性化的康复预后预测。这反过来有助于调整康复强度、规划家庭和工作支持,并为针对长期残疾高风险人群的临床试验设计提供依据。

引用: Olsson, J., Stanne, T.M., Andersson, B. et al. Predicting post-stroke functional outcome using explainable machine learning and integrated data. Sci Rep 16, 12462 (2026). https://doi.org/10.1038/s41598-026-47814-x

关键词: 缺血性卒中, 机器学习, 预后, 血液生物标志物, 来源于大脑的tau蛋白