Clear Sky Science · zh
使用PacBio HiFi和Hi-C技术组装Microtus fortis的染色体级基因组
具有重大科研潜力的小型哺乳动物
苇田鼠是一种生活在中国湿地、体型类似小鼠的啮齿动物,但它远不只是野外的一团毛皮。它对一种严重的人体寄生虫具有天然抗性,能够自发出现与人类疾病类似的某些癌症,并能以高纤维、难消化的食物为生。所有这些特性都使其成为一种异常宝贵的实验动物。然而,直到现在,科学家们仍缺乏该物种的完整遗传蓝图,限制了对它的深入研究。本研究弥补了这一空白:提供了苇田鼠DNA的详细染色体级图谱。

基因组图谱为何重要
高质量的基因组就像生物学的参考地图。研究者不再依赖零散的基因记录,而是得到一套经过精心组织的“染色体长度”章节,展示基因如何排列及可能如何相互作用。对于苇田鼠(Microtus fortis)而言,这尤为重要。它对导致人类血吸虫病的寄生虫Schistosoma japonicum具有天然抵抗力,长期吸引科学家关注。该物种还被用于研究消化、行为和卵巢癌。没有稳固的基因组图谱,很难确定哪些DNA片段塑造了这些不同寻常的性状,或将其基因与小鼠、大鼠或人类的基因进行清晰比较。
遗传蓝图是如何构建的
研究团队选取了一只健康雄性个体的组织样本,以尽可能简化遗传背景。他们提取高质量DNA,并将其用于两种各有所长的现代测序技术。PacBio HiFi测序产生长且高精度的DNA片段,适合拼接基因组的初步草图;Hi-C测序捕获细胞核内不同DNA片段的空间接近关系,为如何将较小片段连接为完整染色体提供线索。研究者还对肌肉、肝脏和卵巢的RNA进行了测序,以观察不同组织中哪些基因被真正表达,从而帮助定位和确认基因位置。
从原始读数到完整染色体
研究人员使用专业软件,先将长DNA读段拼接成称为contig的大块序列,然后去除由于来自同一染色体两份拷贝而产生的重复片段。接着,他们利用Hi-C数据——远距离DNA片段之间的物理接触模式——将这些大块排列和定向,组成符合已知核型(染色体数目)的26条染色体长度序列。最终组装的基因组约为22.9亿个碱基对,连续性很高,几乎全部序列都被分配到了染色体上。质量检测显示,一组标准的重要哺乳动物基因中超过96%存在且完整,这表明组装既全面又准确。

基因组内部揭示了什么
在组装好的基因组基础上,团队分析了其内容。他们鉴定出23,678个编码蛋白的基因,并通过与公共数据库比对及搜索已知蛋白结构域,为几乎所有基因分配了可能的功能。他们还记录了多种非编码DNA,例如活动元件和重复序列,这些序列合计占基因组近42%,以及参与蛋白合成和基因调控的数千个RNA基因。研究者还构建并校验了完整的线粒体基因组——这种小而环状的DNA分子为细胞供能——确保未来的研究可以同时追踪核基因组与线粒体对苇田鼠生物学特性的贡献。
为未来发现奠定基础
通过将曾经支离破碎的苇田鼠DNA图景转化为高分辨率的染色体级图谱,本研究为科学家提供了一个强大的新工具。研究者现在可以系统地搜索赋予苇田鼠对血吸虫寄生虫天然抗性的基因和基因组模式,探索其独特的消化系统,并利用其作为癌症和行为研究模型。该基因组还为啮齿类之间的比较研究提供了重要参考,深化我们对它们体征与防御机制如何进化的理解。在实践层面,这项工作为更有针对性的实验奠定了基础,并最终可能产生有助于人类健康的见解,从传染病控制到癌症研究。
引用: Zhang, D., Hu, Q., He, T. et al. Assembling a chromosome-level genome for the Microtus fortis using PacBio HiFi and Hi-C technologies. Sci Data 13, 447 (2026). https://doi.org/10.1038/s41597-026-06813-3
关键词: 苇田鼠基因组, 染色体级组装, PacBio HiFi和Hi-C, 血吸虫抗性, 啮齿类模式生物