Clear Sky Science · zh

细胞邻域拓扑指导稀有细胞群体识别

· 返回目录

为什么微小细胞群体很重要

我们的身体由大量细胞构成,但其中一些最关键的角色是只占很小比例的稀有细胞类型。这些稀少细胞可以驱动癌症扩散、影响脑病理或协调免疫反应,然而在现代的单细胞和空间组织图谱中它们常常难以被发现。本研究引入了 RareQ,一种新的计算方法,旨在可靠地发现这些隐藏的细胞群体,即使在巨大且复杂的数据集中也能做到。

Figure 1. 网络模式如何揭示隐藏在庞大组织数据集中的微小但重要的细胞群体
Figure 1. 网络模式如何揭示隐藏在庞大组织数据集中的微小但重要的细胞群体

在细胞邻域中寻找模式

传统方法通常通过查看细胞表达的基因并将数据划分为簇来对细胞进行分组。对于常见细胞类型,这种方法通常有效,但往往会将稀有细胞吞并进更大的群体或将其视作噪声。RareQ 采用了不同的路径。它不只是关注基因水平,而是考察每个细胞在其最近邻网络中的位置。如果一个细胞及其近邻在彼此之间高度连接,但与网络其余部分的连接很弱,RareQ 就将该邻域标记为特殊。这个思想被一个称为 Q 的度量捕捉,反映了细胞局部邻域的“团块性”。

将团块转换为有意义的细胞群

利用 Q 得分,RareQ 逐步构建细胞群体。每个细胞起初处于自己的小簇中,然后逐渐采纳其小邻域内 Q 值更高邻居的标签。简单来说,紧密结合的细胞团块作为锚点,吸引附近相似的细胞。标签传播完成后,该方法检查生成的簇在内部是否强连接且与其他簇仅弱连接。具有高平均 Q 的簇被视为候选稀有群体,而较弱的簇则被合并以形成主要细胞类型。该过程使 RareQ 能在无需事先知道种类数量的情况下分离大体量和小体量的细胞群落。

在多种组织上测试 RareQ

作者在数百个模拟和真实数据集上对 RareQ 进行了基准测试,包括血细胞、气道上皮、脑组织、肿瘤和空间图谱。在这些测试中,RareQ 比七种领先方法更准确地检测到稀有细胞类型,通常能发现更多稀有群体并具有更高的精确率和召回率。它也运行更快、内存占用更少,成功分析了超过一百万细胞的数据集,而一些竞争工具在这些情况下失败。在将基因活性与染色质可及性或表面蛋白结合的多模态数据中,RareQ 可以分别应用于各层或在集成视图上使用,常常揭示那些仅基于单一数据类型或依赖复杂深度学习模型的方法无法检测到的稀有细胞类型。

Figure 2. 如何逐步利用紧密连接的细胞邻域将稀有细胞群体从常见群体中分离出来
Figure 2. 如何逐步利用紧密连接的细胞邻域将稀有细胞群体从常见群体中分离出来

揭示健康与疾病中的隐性参与者

通过将 RareQ 应用于具体生物学问题,研究展示了这些隐藏细胞群如何重塑我们对组织的理解。在气道中,RareQ 恢复了已知的稀有上皮细胞并发现了与细胞分裂、纤毛形成和抗病毒反应相关的新亚群。在 B 细胞淋巴瘤和肾癌中,它定位了稀有免疫细胞和肿瘤相关群体,包括具有高检查点活性的树突状细胞,这些细胞可能影响对免疫疗法的反应。在阿尔茨海默病患者的大脑样本中,RareQ 突出了在患者中富集的稀有小胶质细胞和星形胶质细胞状态,其基因模式与炎症、垃圾清除和淀粉样蛋白处理有关。在来自小鼠大脑的高分辨率空间数据集中,它检测到了小型且解剖学上精确的群体,例如海马体内不同的神经元子区域和脉络丛中专门的纤毛上皮细胞,这些在其他方法中被漏检或混为一谈。

这对未来细胞图谱意味着什么

对非专业读者来说,关键结论是 RareQ 提供了一种更灵敏且高效的方式来发现那些常常充当疾病与组织功能控制节点的稀有细胞类型。通过关注细胞与邻居的连接方式,而不仅仅是原始基因水平,RareQ 能从海量数据中剔除小而连贯的细胞群体。这使未来的细胞图谱更为完整,并为研究难以捉摸的细胞状态打开了大门,这些状态可能成为诊断或治疗的靶点。

引用: Fa, B., Huang, C., Ma, Y. et al. Cell neighborhood topology directs rare cell population identification. Nat Commun 17, 4618 (2026). https://doi.org/10.1038/s41467-026-71180-x

关键词: 稀有细胞, 单细胞分析, 空间转录组学, 细胞网络, 计算生物学