Clear Sky Science · zh
针对性长读长测序用于肌强直性营养不良1型高分辨率重复序列剖析
这对家庭和医生为何重要
一些遗传病由我们DNA中“结巴式”重复序列驱动——短序列被重复数百甚至数千次。当这些重复过长时,会导致严重疾病,例如肌强直性营养不良,这是一种肌肉萎缩性疾病。然而,准确测量这些重复的长度以及它们的化学修饰,在目前的医院检测中出乎意料地困难。本文提出了一种在大约一天内详细读取这些难测DNA区域的简化方法,有望为医生提供更清晰的答案,为患者带来更好的指导。

深入观察一种棘手的肌肉疾病
肌强直性营养不良1型(DM1)由一个重要肌肉及其它组织基因中三核苷酸序列过度重复引起。重复越多,患者通常病情越重,因此准确知道重复长度对诊断和预后至关重要。临床实验室的标准工具——如特定的PCR检测和Southern印迹——在重复量适中时表现良好,但当扩增超过几百拷贝时常常失败或变得非常不精确。这就留下了一个灰色地带,家庭可能知道存在突变但无法清楚了解其程度或随时间如何变化。
将分子剪刀与长读长DNA测序结合
研究团队构建了一个四步工作流程,直接解决这些难以读取的重复。首先从血液或细胞样本中提取DNA。接着,团队使用CRISPR–Cas9——由向基因组中特定位置导向的分子剪刀——在包含重复的DNA两侧切割。由于只有被切割的片段被制备用于测序,该方法显著富集了目标区域,同时避免了PCR扩增,PCR通常会遗漏非常大的扩增片段。随后将制备好的DNA送入纳米孔测序仪,这是一种手持设备,将DNA链穿过微小孔道并实时通过电信号感知其组成。
智能软件读取长度和化学标记
测序仪输出的原始信号必须被翻译成DNA序列并转化为有意义的测量结果。作者在此介绍了RepeatLab,一套自动化分析流程,可在普通云记事本上运行。RepeatLab首先进行快速扫描以找到覆盖目标基因的读段,然后使用为长而重复序列定制的更高精度设置对这些读段进行重新处理。它采用改进的统计策略,将单分子测量聚类为两组——通常对应个体中的正常拷贝和扩增拷贝——在大约十几条读段下即可获得可靠的长度估计。相同框架还能在一次运行中分析多份样本或多个基因,成本与现有临床检测相当。
查看插入中断与表观遗传信号
除了简单计数重复次数外,该方法还检查重复区的精细结构及其化学修饰。有些患者在重复中带有中断——重复序列内的小片段不同序列——这可能与较轻的病情相关。团队发现许多表面上的中断实际上是原始信号处理带来的伪影,并展示了在解码时使用更大分析窗口能大幅减少这些假阳性。RepeatLab还使用专门模式读取DNA甲基化,这是一种可开关基因表达的化学标记。在DM1基因周围,作者以单等位基因分辨率绘制了甲基化模式,并识别出若干关键区域,在这些区域中更重的甲基化与更长的重复扩增相关联,支持了这些化学标记在塑造疾病进程中的作用。

对难以测量的重复更快、更丰富的检测
综合来看,这项工作表明CRISPR引导富集、纳米孔长读长测序和易用软件可以在24小时内提供疾病致病重复的详细剖析。对于DM1及相关疾病,该方法不仅测量重复长度,还捕捉当前医院检测大多遗漏的细微序列变化和表观遗传模式。尽管仍需进一步验证并适配更新的测序化学体系,但这一综合平台指向未来更快速、信息更丰富、且更易在常规护理中部署的遗传检测。
引用: Han, Y., Jang, JH. & Chang, H. Targeted long-read sequencing for high-resolution repeat profiling in myotonic dystrophy type 1. Exp Mol Med 58, 1203–1215 (2026). https://doi.org/10.1038/s12276-026-01683-6
关键词: 肌强直性营养不良, 串联重复扩增, 纳米孔测序, CRISPR Cas9 富集, DNA 甲基化