Clear Sky Science · zh
基于纵向建模的三年期新冠后综合征研究:使用临床、神经心理和体液标志物的机器学习方法
为什么新冠后长期症状仍然重要
全球有数百万人在感染新冠病毒数月甚至数年后仍感不适。该病况通常称为长新冠或新冠后综合征,可能带来压倒性的疲劳、“脑雾”、睡眠问题以及其他难以通过常规医学检查明确的症状。这里描述的研究对一组成年人在感染后三年内进行了随访,利用现代计算技术在血液、临床检查和认知功能测试中寻找模式,以揭示长新冠随时间如何变化以及哪些测量最能反映恢复或持续的疾病状态。
对患者进行长期随访
德国的研究人员招募了93名既往确诊感染SARS‑CoV‑2且存在持续神经或神经心理学不适的成年人。这些参与者大多处于中年阶段,接受了四次检查:大约在感染后6个月、14个月、23个月和38个月。在每次随访中,他们填写了关于疲劳、情绪和睡眠的详细问卷;接受了简短和更全面的注意力、记忆和心理反应速度测试;并采集血样用于广泛的实验室检测。这些检测包括常规健康指标、炎症信号、免疫系统活性指标以及在脑细胞受损时释放的特异性蛋白质。

让计算机发现潜在模式
研究团队没有单独观察某一症状或血液检测指标,而是转向机器学习——人工智能的一个分支,能够同时筛查大量变量并发现细微关系。他们训练了一系列计算模型来回答一个具体问题:基于一次门诊的综合数据,算法能否判断该次随访属于哪一年?换言之,一个人在6个月时的总体特征是否与2年或3年时有可测量的差异?研究人员对缺失值进行了谨慎处理,使用交叉验证以避免在小样本上过拟合,并比较了不同类别的模型,从简单的决策树到复杂的梯度提升方法。
哪些信号最能“判断时间”
模型的表现令人瞩目。在比较时间间隔较远的随访(例如第一次与第四次)时,某些算法能在超过90%的案例中正确地判断随访年份。即便在较接近的时间点之间,准确率仍然很高,第三次与第四次随访之间的准确率仅略有下降,表明患者在后期的特征变化更为缓慢。表现最好的方法是基于树的梯度提升模型,这类模型擅长发现非线性模式。为了解开“黑箱”并弄清哪些因素驱动了这些判断,团队使用了称为SHAP和LIME的可解释性工具,来对推动某一预测方向的特征进行排序。
免疫线索、脑雾与重要性的转变
多项分析显示了一个一致的图景。血液中炎症分子的水平——尤其是某些白介素如IL‑2、IL‑8和IL‑10——是区分早期与晚期随访的最强线索之一。对病毒的抗体反应指标,特别是针对刺突蛋白的抗体(随时间也反映接种疫苗的情况),也是有力的指示。在认知方面,语言记忆与词汇检索测试,以及与疲劳和嗜睡相关的评分,在感染早期提供了重要信息。随着时间推进,免疫标志物在模型中的权重趋于增加,而一些神经心理学测量的重要性则下降,这暗示长新冠的生物学驱动因素可能随着多年而演变。

对患者与护理的意义
对非专业人士来说,关键结论是长新冠并非仅仅是一系列模糊的主诉。经过多年细致追踪,血液中的客观信号和认知功能测试的结果会以计算机可以可靠识别的方式发生变化。这项研究表明,免疫标志物、抗体水平以及针对性的认知和疲劳评估的组合,可能帮助医生监测谁在恢复、谁仍有长期问题的风险,以及哪些患者可能最受益于以免疫系统为靶点的新兴治疗方法。尽管在这些工具进入常规临床实践之前还需要更多且更大规模的研究,但这项工作展示了人工智能如何把长新冠的混沌现实转化为对患者和临床医生更清晰、可操作的信息。
引用: Walders, J., Wetz, S., Costa, A.S. et al. Longitudinal modeling of Post-COVID-19 condition over three years: A machine learning approach using clinical, neuropsychological, and fluid markers. Sci Rep 16, 6517 (2026). https://doi.org/10.1038/s41598-026-37635-3
关键词: 长新冠, 机器学习, 炎症, 认知症状, 免疫生物标志物