Clear Sky Science · zh

将空间转录组学与组织形态学相结合

· 返回目录

从两种不同视角洞察组织

医生和科学家越来越希望不仅知道组织中哪些基因处于活跃状态,还要明确它们在组织中的精确位置。与此同时,医院的显微镜已经每天拍摄出病理学家用于诊断的丰富组织结构图像。本文解释了一个新兴领域如何尝试将这两种视角——详细的基因活性图谱与普通显微镜图像——连接起来,以及这种结合为何可能带来更早的诊断、更好的癌症分级和对疾病如何发展与扩散的更深刻理解。

Figure 1
Figure 1.

从分散的细胞到基因活性地图

多年来,强大的“组学”方法通常要求将组织研磨成单个细胞混合物,这会破坏有关每个细胞来源位置的信息。空间转录组学改变了这一点:在保留每个细胞在组织中位置的同时测量基因活性。其结果是一张点阵网格,每个点都有基因表达谱和精确坐标。单凭这些空间基因数据,研究者已经发现了新的细胞多样性和疾病结构模式。但这种数据一旦测量就不可更改,重复实验代价高昂。相比之下,用常规染色(如广泛使用的苏木精-伊红,H&E)得到的组织图像便宜且数量充足,且包含关于细胞形状、密度和组织结构的可视线索。

结合图片与基因的两种方式

综述提出了一个简单但有力的框架来共同利用这两类数据。首先,将图像小块与附近的基因表达点配对。然后,计算模型从图像中提取特征——捕捉形状、纹理和组织结构的模式——并将其与基因表达模式进行比较。作者描述了两种理想情景。“翻译”中,图像特征紧密跟随相关基因活性,使模型仅基于组织图像就能预测哪些基因被激活。这可用于填补缺失的基因测量、实现比原始网格更细的分辨率,或从常规临床切片推断基因活性而无需额外实验室工作。“整合”中,图像特征捕获了基因数据未能反映的有用信息,例如缓慢的结构性变化或微妙的组织格局,从而有助于更清晰地定义组织内的区域或“域”。

额外信息何时有益——何时有害

并非每个图像特征都值得使用。作者引入了一个概念图,包含两条轴:图像特征对生物学问题的相关性,以及其与基因信息的重叠程度。既不相关也不与基因有关的特征相当于噪声,例如染色伪影。那些跟随基因模式但对应无关紧要基因(如基本的管家基因)的特征,可能会让模型在纸面上看起来不错,却几乎没有临床价值。通过将方法按四个象限组织——翻译、整合、噪声和高估——该框架澄清了何时结合图像与基因确实增加见解,何时只是重复或掩盖已有信息。

Figure 2
Figure 2.

现有工具、测试与成长的阵痛

一股快速发展的人工智能方法潮流正尝试在真实数据上执行翻译与整合。早期系统依赖卷积神经网络,而较新的方法采用了变换器、图神经网络和可涵盖从微小细胞结构到整片切片上下文的多尺度模型。这些方法已被用于从H&E图像预测基因活性、生成超分辨率图谱,并帮助识别具有不同功能的组织区域。为评估性能,研究者依赖统计度量,例如预测与观察到的基因水平之间的相关性,或AI定义区域与病理学专家标签之间的一致性。然而,数据集仍然较小且多样,跨研究比较困难。许多报告的提升可能反映了过拟合,或仅在对临床意义不大的基因和模式上取得成功。

未来可能的方向

作者总结认为,将空间基因图谱与组织图像结合是一项有前景但仍处于早期的尝试。现有模型通常只达到中等准确度,尚未证明可用于常规医疗。未来的进展可能来自更好的图像特征,尤其是在数百万张病理切片上训练的大型“基础模型”,以及聚焦于真正影响患者护理的基因和模式。精心设计的整合有朝一日可能通过发现组织当前外观与其基因预测之间的不匹配,揭示疾病的早期警示信号。简言之,这项工作为将常规显微图像转化为富含基因信息的图谱铺设了路线图,帮助医生更精确地理解和治疗疾病。

引用: Chelebian, E., Avenel, C. & Wählby, C. Combining spatial transcriptomics with tissue morphology. Nat Commun 16, 4452 (2025). https://doi.org/10.1038/s41467-025-58989-8

关键词: 空间转录组学, 组织形态学, 数字病理学, 基因表达预测, 影像人工智能