Clear Sky Science · zh
整合多组学与多表型数据以识别与体能相关的生物通路
为何巅峰表现不仅仅是刻苦训练
有些人似乎天生适合高强度的体能挑战,从顶级运动员到军队人员不一而足。本研究提出了一个简单却有力的问题:我们能否通过解读一个人的“隐性生物学”,来理解为何某些身体表现出色——甚至在仅有少量志愿者的情况下预测谁会表现优异?作者将详尽的体能测试与深度生物学测量结合,展示了血液化学与细胞机制如何揭示与高体能相关的过程网络。

跟踪学员在训练与日常生活中的表现
研究人员在三个月内追踪了86名美国军事学院的高强度训练学员。所有人都已具备良好体能并正接受强度训练。每位学员完成了美国陆军战斗体能测试(Army Combat Fitness Test),这是一项包含举重、负重冲刺与限时跑等六项严苛考核的考试,满分为600分。本研究中60%的男性得分超过540分——陆军视此为卓越水平——因此研究聚焦于已经较高表现者之间的差异。除这些测试外,学员佩戴设备追踪睡眠与日常活动,完成认知与人格评估,并在实验室以其最大摄氧量的固定比例进行骑行,研究者在运动前后采集血样。
将成千上万项测量整合为连贯图景
仅从血液中,团队就获取了超过5万项分子测量:DNA甲基化标记、基因表达、蛋白质、代谢物,以及免疫和临床指标。经典的统计方法可能会逐一检索每个分子与体能得分的相关性,但在变量众多而受试者仅为数十人的情况下,这几乎必然产生噪声大且误导性的结果。相反,作者构建了名为PhenoMol的框架,首先筛选出与体能存在哪怕是温和关联的分子候选,然后将这些候选映射到已知的人类基因、蛋白与代谢物相互作用图谱中。借助图论工具,该方法剔除孤立信号,保留形成连接的“表达回路”的分子群,合理地与表现相关联。
能预测谁会脱颖而出的网络
在获得这些回路后,团队训练模型来预测每位学员的体能得分。与忽略网络信息、仅尝试挑选最佳单个分子的模型相比,PhenoMol模型在准确性上有明显提升,尽管其使用的特征远少于传统方法。该网络还可以拆分为模块——紧密相连的分子簇——每个模块捕捉不同的生物学主题。当将这些模块组合成“集成”模型时,它们对总体体能得分的预测能力与仅基于传统指标(如体成分、摄氧量与睡眠)的模型相当。值得注意的是,预测对已经表现优异的学员更为准确,这反映出该队列中低分者较少。

身体通路揭示的高体能线索
由于PhenoMol立足于已知生物学,作者能够解释哪些通路最为重要。他们在参与血液凝固与免疫防御的系统中发现了强烈信号,在影响肌肉代谢的胆汁酸处理通路中也有明显关联,以及涉及精氨酸、脯氨酸和色氨酸等氨基酸代谢的通路。这些过程与血流、能量利用、肌肉修复及对压力的恢复力相关——是持续表现的关键要素。与疲劳相关的氨清除有关的尿素循环相关分子也与更好成绩相关。研究结果并非单一“神奇”生物标志物,而是强调跨多个通路的协调性变化,共同将高水平表现者与同侪区分开来。
从分子回路走向个性化训练
直白地说,这项研究表明:即便在样本量相对较小的群体中,利用深度但嘈杂的分子数据也能发现生物学上合理的模式来预测体能。通过将测量嵌入已知的相互作用网络,PhenoMol能从噪声中筛选出信号,并指向具体通路——如免疫反应、胆汁酸信号传导与氮代谢——这些通路可能帮助解释为何某些个体的表现与恢复更佳。作者认为,这一通用方法可用于指导个性化训练、营养与恢复方案,并可扩展到健康管理、疾病风险或因样本受限而只能研究小群体的罕见疾病等其他领域。
引用: Alizadeh, A., Graf, J., Misner, M.J. et al. Integration of multiomic and multi-phenotypic data identifies biological pathways associated with physical fitness. Commun Biol 9, 464 (2026). https://doi.org/10.1038/s42003-026-09663-2
关键词: 体能, 多组学, 生物标志物, 运动生物学, 系统生物学