Clear Sky Science · zh

在单细胞RNA测序中使用scPCA联合建模细胞异质性与条件效应

· 返回目录

这对理解细胞为何重要

现代生物学现在可以一次读取成千上万个单个细胞中哪些基因处于活跃状态。但当科学家比较不同处理、年龄或遗传背景下的细胞时,数据量之大令人不知所措,且技术性偏差很容易掩盖真实的生物学变化。这篇文章介绍了一种新的分析工具scPCA,帮助研究人员将不同条件下细胞中真正发生的变化与细胞类型之间存在的自然多样性区分开来。

从噪声数据到清晰模式

单细胞RNA测序测量每个细胞中数千个基因的活性,产生极高维的数据。为了解读这些数据,研究人员通常用主成分分析(PCA)之类的方法进行压缩,找到能够捕捉主要变异模式的一小组“轴”。然而,传统方法会将两种截然不同的变异来源混在一起:细胞类型的固有差异和实验引起的变化(例如药物处理)。作者指出,这种混合可能会误导后续分析,如将细胞聚类为类型或寻找处理效应。

在条件间共享结构的新方法

scPCA通过显式告知分解模型每个细胞来自哪个条件来解决这个问题,然后为每个条件学习一组独立但相互关联的基因表达模式。scPCA并不强制所有样本共享完全相同的底层结构,而是允许每个条件对每个成分有自己的版本,并相对于指定的参考条件作轻微偏移。这既保留了用于跨条件比较的公共坐标系,又能捕捉由处理、衰老或遗传改变驱动的系统性表达位移。

Figure 1
Figure 1.

在免疫细胞中见到真实的处理效应

作者在系统性红斑狼疮患者的免疫细胞上演示了scPCA,其中一些细胞未处理,另一些用干扰素-β刺激(这是一个强烈的免疫信号)。标准分析使细胞按细胞类型和处理同时聚类,导致结果难以解释。使用scPCA后,不同条件下同一类型的细胞更好地对齐,显示出主要变异轴仍然反映免疫细胞谱系而非仅由处理驱动。在考虑细胞类型之后,scPCA才突出了髓系细胞中特定基因受处理影响的位移,包括与干扰素信号传导和细胞内蛋白质处理改变相关的基因。这表明该方法可以清晰地将细胞身份与其反应区分开来。

解开技术伪影与衰老效应

实验常常受到批次效应的影响:由样本处理引起而非生物学的微妙差异。作者用在不同批次测量的两种人源细胞系的混合样本表明,标准PCA会保留这些技术差异,而通过将批次作为条件变量处理,scPCA可以在很大程度上去除它们。该方法随后揭示出导致表观批次分离的基因,包括每个细胞系特有的标记。在一个更复杂的例子中,scPCA被应用于来自年轻和年老小鼠的肺细胞。它找到与主要细胞类型(如肺泡细胞、纤毛细胞、巨噬细胞和T细胞)对齐的成分,并在每种细胞类型内定位与年龄相关的基因变化,包括与应激和免疫反应相关的基因,这与“炎性衰老”(inflammaging)的概念相一致。

Figure 2
Figure 2.

追踪细胞随时间及干预的反应

scPCA还可处理多于两个条件的实验,例如在一定暗期后暴露于光照的小鼠视皮层神经元。通过将时间点视为条件的不同水平,该方法在若干脑细胞类型中恢复出早期和晚期的基因活动波,区分快速的“早期反应”因子与较慢的“晚期反应”程序。在一个去除关键发育基因chordin的斑马鱼实验中,scPCA成功整合了尽管细胞类型组成发生巨大变化的胚胎,并揭示出符合体轴模式改变的转录学变化,包括原始分析中未被强调的基因。

这对未来单细胞研究意味着什么

简单来说,scPCA为研究人员提供了一种更清晰的透镜,用以查看在不同条件下采集的单细胞数据。它生成集成图谱,使相似细胞在不同处理间对齐,并指出在每个共享模式中哪些基因在对刺激、衰老或遗传改变作出反应时上调或下调。尽管该方法假设底层结构在很大程度上是共享的,并且最适合用于仍需后续验证的探索性工作,但它提供了比许多黑箱模型更透明且更易解释的替代方案。这有助于科学家从日益复杂的单细胞实验中得出更可靠的结论。

引用: Vöhringer, H. Joint modeling of cellular heterogeneity and condition effects with scPCA in single-cell RNA-seq. Commun Biol 9, 492 (2026). https://doi.org/10.1038/s42003-026-09651-6

关键词: 单细胞RNA测序, 降维, 细胞异质性, 基因表达变化, 批次效应