Clear Sky Science · zh
mist:用于检测单细胞数据中差异性DNA甲基化动力学的层次贝叶斯框架
追踪塑造细胞的标记
你身体中的每个细胞都携带相同的 DNA,然而脑细胞、心肌细胞和免疫细胞的行为却大相径庭。其一原因是 DNA 上的化学标记,例如甲基基团,它们有助于开启或关闭基因。借助新工具,科学家现可在成千上万个单细胞中读取这些标记,观察细胞在发育或变化过程中发生的改变。本文介绍了“mist”——一种统计方法,可将这些庞大且噪声很高的测量数据转化为关于这些 DNA 标记随时间在发育和疾病中如何变化的清晰叙述。

解读 DNA 上的化学线索
DNA 甲基化是对 DNA 碱基胞嘧啶的一种小的化学添加,常发生在称为 CpG 的位点上,在控制哪些基因处于活跃状态方面起着核心作用。以往使用整体样本(bulk)进行的研究表明,甲基化参与衰老、应激反应和癌症,并且在细胞分裂时可以被继承。近年来,单细胞 DNA 甲基化技术使得可以对每个单独细胞的甲基化状态进行测量,揭示出在整体样本中会被平均掉的丰富细胞间差异。然而,这些测量通常稀疏且噪声大,到目前为止还没有专门的工具来追踪甲基化如何在细胞沿着推断的“伪时间”——把细胞从早期排列到晚期的时间线——连续变化。
沿着看不见的时间线追踪细胞
在许多现代实验中,研究者使用其他方法估计伪时间,将个别细胞沿着代表发育或疾病过程的路径排列。mist 以这种细胞排序及按基因或诸如启动子等区域分组的单细胞 DNA 甲基化数据为起点。它接着将每个基因的甲基化水平建模为伪时间上的平滑曲线,并允许生物学变异的大小在早期和晚期阶段不同。这一点很重要,因为早期发育阶段通常更加多样和可塑,而晚期阶段更稳定。通过把这些特性纳入层次化的贝叶斯框架,mist 能在高度稀疏的数据中将真实的生物学模式与随机噪声区分开来。
从曲线到关键基因角色
一旦 mist 学会了每个基因的平滑甲基化轨迹,它就采用一个简单而有力的想法来发现重要变化:测量曲线之间的面积。在单个细胞组内,它将某基因的轨迹与一条平直线进行比较,以标记那些随伪时间显著变化的基因。在比较两组(例如两个脑区)时,它会将两条轨迹对齐并测量它们总体上的距离,侧重于形状上的差异而非仅仅基线水平。在大量计算机模拟中,mist 比广泛使用的替代方法(如广义加性模型和标准多项式回归)更准确地恢复了真实的甲基化模式并识别出差异甲基化基因。它也优于另一种忽视伪时间的甲基化方法,凸显了明确建模细胞时间顺序的价值。
用表观遗传的视角观察发育
作者将 mist 应用于真实的多组学数据集,以展示这些统计改进在生物学上的意义。在小鼠胚胎中,mist 发现了甲基化模式与已知谱系转变相吻合的基因,包括心脏发育的调控因子、免疫细胞形成相关基因以及干细胞潜能丧失相关基因。在发育中的人类大脑组织中,它揭示了在从胎 gestation 到成年不同阶段,额叶皮层与海马体的甲基化演变存在差异的基因。例如,一个与记忆相关信号通路密切相关的基因在海马轨迹上呈递减的甲基化,符合该区域活性增加的情形;而额叶皮层中与生长相关的受体在组织成熟过程中甲基化增加,暗示功能从生长向长期功能的转变。这些发现说明了 mist 如何将 DNA 上的微妙化学变化与细胞身份和脑回路的重大转变联系起来。

这对未来研究的重要性
通过提供一种循序追踪单细胞中 DNA 甲基化动力学的有原则方法,mist 填补了表观基因组研究工具箱中的关键空白。它专为稀疏的比例甲基化数据设计,能够突出在细胞发育或分化为不同谱系或组织区域时其调控行为发生变化的基因。尽管该方法依赖于良好的伪时间估计,且在非常细的基因组区域上计算量可能很大,但在基因或启动子水平上已具有实用性并作为开源软件提供。对于非专业读者,主要信息是:mist 有助于将庞大且嘈杂的单细胞甲基化数据转化为清晰的地图,指出在发育、衰老和疾病过程中何时何地发生重要的调控开关翻转。
引用: Duan, D., Ma, W., Tang, W. et al. mist: a hierarchical Bayesian framework for detecting differential DNA methylation dynamics in single-cell data. Nat Commun 17, 3835 (2026). https://doi.org/10.1038/s41467-026-70523-y
关键词: 单细胞 DNA 甲基化, 伪时间 分析, 贝叶斯 建模, 表观遗传 调控, 发育 轨迹