Clear Sky Science · zh
一个机器学习框架揭示了健康人群细胞因子反应的关键驱动因素
为什么我们的免疫反应不同
当两个健康的人感染同一种感冒时,一个人可能只是轻微打喷嚏,而另一个人可能卧床好几天。造成这种差异的重要原因之一是他们的免疫系统释放信号蛋白——细胞因子的强弱不同。本研究提出了一个简单但重要的问题:是否可以通过结合遗传因素和日常变量(如季节、既往感染和血液指标)来预测一个健康人的免疫反应强度?
深入观察健康免疫系统
为此,研究者招募并精心挑选了406名健康成人,所有人在标准化条件下接受检测。研究团队在清晨禁食后采血,测定激素水平和免疫细胞计数,并记录性别、年龄、体重及采样季节等因素。随后,他们用模拟病原体的物质刺激新鲜全血,激活两大免疫分支:识别广泛危险信号的 Toll 样受体(先天免疫前哨)和识别特定靶标的 T 细胞受体(适应性免疫)。团队测量了11种不同的细胞因子反应,构建出在受控实验挑战下每个人免疫反应的丰富图谱。 
发现强应答者与弱应答者的模式
第一步是判断人群是否自然分为可识别的免疫“类型”。通过检查关键细胞因子 IL-6 对几种先天刺激物的反应,研究团队发现了两类主要人群:高产者和低产者。对一种先天触发因素产生更多 IL-6 的个体通常对其他相关细胞因子也有较高分泌,表明存在稳定的反应谱。高 IL-6 产生者更常见于男性、单核细胞数量较高、且更常在冬季采样,这突出了生物学与环境如何在一年中共同塑造免疫基底调性。
基因与环境:谁主导何种反应?
接着,研究者在全基因组范围内扫描与细胞因子水平相关的 DNA 变异,发现四个明显影响某些反应的区域,其中包括一个已知会影响 T 细胞驱动细胞因子的变异。但基因只解释了部分情况。研究团队随后比较了多种预测方法,从简单线性模型到更灵活的机器学习技术,如随机森林和梯度提升树。仅用遗传数据预测细胞因子反应时,只有少数与 T 细胞相关的细胞因子能够被较为准确地预测。一旦加入生物学与环境信息——例如血液计数、季节与既往巨细胞病毒暴露史——模型性能显著提升,尤其是在先天受体反应方面,此类反应的纯遗传信号较弱。
表现最佳的模型揭示了什么
表现最可靠的是一种基于树的算法,称为随机森林。通过扰动每个输入特征并观察预测性能的下降,作者识别出真正重要的特征。对于由 T 细胞驱动的细胞因子,遗传变异是主要驱动因素,年龄和慢性病毒暴露起次要作用。对于像 IL-6 和 TNF 这样的先天受体驱动细胞因子,季节时点和单核细胞计数比 DNA 标记更具影响力。研究团队还演示了如果错误地进行特征选择,容易高估遗传的作用,并在近500名非吸烟者的独立队列中验证了主要发现。有趣的是,针对自身免疫疾病的广义基因风险得分并未提升预测能力,表明易患疾病的基因并不简单等同于调节健康人日常免疫反应的基因。
这对未来个体化免疫意味着什么
对普通读者而言,结论是我们的免疫反应并非仅由基因决定。某些细胞因子,尤其是由 T 细胞驱动的,受遗传变异的强烈影响。另一些,特别是由像 Toll 样受体这样的先天感受器产生的,则更多依赖于变化因素,如季节、细胞计数、激素和既往暴露史。现代机器学习工具能将这些片段编织在一起,从而对谁可能是强或弱应答者进行排序,但这些工具有其局限性,必须谨慎使用以避免误导性的乐观结论。总体而言,这项工作将我们更接近于预测个体免疫行为,同时强调基因组与日常环境共同书写了我们对感染反应的强度。
引用: Liefferinckx, C., Bottieau, J., Quertinmont, E. et al. A machine learning framework reveals key drivers of cytokine responses in a healthy human cohort. npj Syst Biol Appl 12, 45 (2026). https://doi.org/10.1038/s41540-026-00671-w
关键词: 细胞因子反应, 机器学习, 免疫变异性, 遗传与环境, 系统免疫学