Clear Sky Science · zh

scTWAS:用于单细胞转录组范围关联研究的强大统计框架

· 返回目录

为何关注单个细胞能改变医学

大多数疾病的遗传学研究像是在倾听人群的喧闹声:能听到整体的轰鸣,却听不到每个人在说什么。本文展示了如何把耳朵调整到个体声音上。作者引入了 scTWAS,一种通过使用单细胞 RNA 测序数据,将 DNA 差异与疾病联系起来的新方法,能够在特定细胞类型乃至更细的细胞亚型中查看基因活动。更清晰的视角揭示了哪些确切的细胞——以及这些细胞中的哪些基因——在推动血液疾病、自身免疫疾病和阿尔茨海默病等疾病方面起作用。

Figure 1
Figure 1.

从整体组织到单细胞

十多年来,研究者采用一种称为转录组范围关联研究(TWAS)的策略来将遗传变异与疾病联系起来。TWAS 包含两步:先学习 DNA 变异如何影响基因活性,然后检验每个基因的遗传预测表达是否与某个表型(如血小板计数或痴呆风险)相关。迄今为止,几乎所有 TWAS 工作都依赖“整体”组织样本,在这些样本中来自多种细胞类型的 RNA 混合在一起。这种混合掩盖了重要差异:例如,脑中小胶质细胞里某基因的遗传调控可能与同一基因在神经元中的调控大相径庭,而只有其中部分细胞对特定疾病真正重要。

单细胞数据噪声问题

新出现的人群规模单细胞 RNA 测序现在可以在许多人中测量每人数千个独立细胞。但这些数据很杂乱:计数稀疏(大量零值),强烈受实验技术性偏差影响,并且即使生物学相同,细胞间也存在很大差异。早期将单细胞数据接入 TWAS 的尝试,使用了从整体 RNA 方法借用的临时归一化技巧,希望这些步骤能抑制噪声。作者表明,这类捷径可能扭曲基因活性的真实遗传效应,导致预测能力变弱和发现的基因—疾病关联减少,尤其在稀有或难以测量的细胞类型中更为明显。

scTWAS 如何净化信号

scTWAS 通过明确将生物学信号与测量误差分离来应对这些挑战。首先,它在每个人和每种细胞类型内汇总单细胞计数为“伪整体”谱,减少稀疏性同时保留细胞类型特性。然后它采用两层统计模型:一层描述 DNA 变异和诸如年龄等基本特征如何影响某人在给定细胞类型中真实潜在的基因活性;另一层则建模测序设备如何将该活性转化为带噪声的计数,包括测序深度变化的影响。通过使用专门的加权回归算法拟合该模型,scTWAS 对噪声最大的样本降权,更准确地估计每个基因在每种细胞类型中的遗传调控表达。

在其真正作用的细胞中发现疾病基因

一旦这些细胞类型特异的预测模型训练完成,scTWAS 将它们代入大规模的全基因组关联研究以检验基因—性状关联。在模拟数据(模仿真实单细胞实验)中,scTWAS 在预测准确度和统计检出力方面持续优于现有方法,尤其对数据最稀缺的稀有细胞类型提升显著。将该框架应用于免疫细胞时,作者表明 scTWAS 识别出的与 29 项血液性状以及类风湿性关节炎、狼疮和哮喘相关的基因数量显著更多。其中许多信号突出了特定免疫细胞类型——例如某些单核细胞或 T 细胞亚群——作为某些基因影响疾病风险的主要舞台,而这些关联在整体血液分析中完全被忽略。

在阿尔茨海默病中洞察脑细胞亚型

scTWAS 在大脑中的表现更具洞察力。作者使用数百例捐献人脑的单核数据,为六种主要脑细胞类型和 75 个更细的亚型建立了预测模型。随后他们将这些模型与阿尔茨海默病的遗传数据结合,绘制出在细胞分辨率下风险基因可能发挥作用的图谱。有些基因在多种细胞类型中都有表现,提示它们在大脑中具有广泛作用;而另一些则表现出惊人的特异性。例如,已知的风险基因 MS4A6A 仅在与脂质处理相关的疾病相关小胶质细胞亚型中显示出强关联,而 PPP1R37 则仅在靠近著名 APOE 风险区的一种炎性小胶质细胞亚型中相关。这些模式指向不同的小胶质细胞状态,作为某些遗传变异驱动阿尔茨海默病风险的关键参与者。

Figure 2
Figure 2.

对未来治疗的意义

对非专业读者而言,主要信息是:基因作用的地点可能与基因本身的功能同样重要。通过将 TWAS 从混合组织推进到精确的细胞类型和亚型,并通过细致建模单细胞测量的技术特性,scTWAS 揭示了此前不可见的基因—疾病连接。这一更为精细的图谱有助于研究者锁定应成为新药物或干预靶点的确切细胞群体和通路,从血液生成与免疫到阿尔茨海默病中大脑免疫细胞的干预方向。

引用: Lin, Z., Su, C. scTWAS: a powerful statistical framework for single-cell transcriptome-wide association studies. Nat Commun 17, 3853 (2026). https://doi.org/10.1038/s41467-026-70374-7

关键词: 单细胞基因组学, 遗传风险定位, 免疫细胞, 阿尔茨海默病, 统计遗传学