Clear Sky Science · zh

对34种用于从空间分辨转录组学数据中检测空间可变基因的计算方法的分类

· 返回目录

为什么位置对基因很重要

我们的身体由细胞构成,这些细胞不仅在功能上各不相同,而且在组织和器官中的位置也不同。新的“空间转录组学”技术现在可以在保留每个细胞在组织图上位置信息的同时读取哪些基因处于活跃状态。这篇综述解释了科学家如何检测其活性随位置变化的基因——所谓的空间可变基因——以及就如何发现它们达成共识为何对理解癌症、大脑功能和许多其他疾病至关重要。

Figure 1
Figure 1.

从零散的细胞到生命地图

传统的单细胞研究在成千上万个单个细胞中测量基因活性,但会丢失这些细胞来源于何处的信息。空间转录组学通过直接在薄组织切片上测量基因活性来填补这一空白。每次测量都与切片上的一个“点位”相关联,该点位可能包含一个或多个细胞,具体取决于所用技术。基于成像的方法以非常高的空间分辨率定位几百个选定基因,而基于测序的平台以较低的分辨率捕获几乎所有基因。这些方法共同将组织切片转化为色彩斑斓的基因活动地图,能够揭示隐藏的结构,例如大脑的层次或肿瘤内的不同区域。

三类与位置相关的基因

已经提出了许多计算方法来挑选在这些组织地图上显示出有意义模式的基因,但它们并不都在寻找相同的东西。作者将34种现有方法分为三类。第一类寻找“总体”空间可变基因,这类基因的活性在组织中以任何非随机的方式变化——可能形成条带、簇或梯度。第二类关注“细胞类型特异”的空间基因,这类基因在单一种细胞内发生变化,有助于区分例如神经元亚型或免疫细胞的不同状态。第三类搜索“区室标记”基因,这些基因在特定区域或层中被强烈激活,使其成为这些组织分区的有用标签。

Figure 2
Figure 2.

针对不同模式的不同工具

综述解释了这些方法的内部工作原理。有些方法将组织切片视为二维空间中的点,并使用数学“核函数”来寻找诸如斑点或波动之类的模式。另一些方法首先将相邻位置连接成网络或图,然后检验高表达是否倾向于沿着图的连边聚集。某些工具依赖具有明确定义错误率的正式统计检验,而另一些主要通过基因模式的显著性对基因进行排序。针对非常特定模式的方法在数据符合其预期时可能非常强大,但也可能错过更不规则或更复杂的形状,如许多癌症中观察到的形态。灵活性与速度之间也存在权衡:有些方法可扩展到数十万个点位,而另一些则难以处理非常大的数据集。

这些基因能揭示什么

一旦识别出空间可变基因,它们就成为更深层次生物学发现的原料。总体空间基因常作为第一道筛选,用于在将点位分组为“空间域”——细胞表达谱相似的区域——之前减少基因数量。这些空间域可以与已知的组织结构对齐、提示新的子区域,或突出显示不同的细胞邻域,例如肿瘤的侵袭前沿。区室标记基因有助于解释每个区域的独特性,并可重复用于标注其他样本中的相似结构。与此同时,细胞类型特异的空间基因有望更细致地展现特定细胞类型在组织中如何变化,这可能阐明肿瘤–免疫相互作用或大脑中的特化回路。

挑战与前路

作者强调,没有一种方法适用于所有任务,公平比较工具需要仔细考虑每种方法实际上旨在发现哪种类型的空间基因。他们呼吁使用更真实的数据集进行更好的基准测试、建立更清晰的统计标准以避免虚假发现,并开发尊重不同技术与组织类型差异的新方法。对非专家而言,关键信息是空间可变基因将平铺的基因列表转变为生动的地图,将分子活动与组织结构联系起来。稳健的检测与解释方法将是将空间转录组学转化为关于发育、大脑功能和疾病的实用见解的核心。

引用: Yan, G., Hua, S.H. & Li, J.J. Categorization of 34 computational methods to detect spatially variable genes from spatially resolved transcriptomics data. Nat Commun 16, 1141 (2025). https://doi.org/10.1038/s41467-025-56080-w

关键词: 空间转录组学, 空间可变基因, 基因表达模式, 组织微环境, 计算基因组学