Clear Sky Science · zh
日本泥鳅(Hypomesus nipponensis)的端粒到端粒参考基因组组装
为何这条小鱼很重要
日本泥鳅是一种在东亚寒冷湖泊和河流中繁盛的小型银色鱼类,生长迅速、繁殖快,并支撑着地方渔业。驱动这些性状的是书写在DNA中的遗传说明书。直到现在,科学家们手中只有不完整的版本,缺页与模糊之处不少。本研究提供了该物种首个完全连续、无缺口的基因组图谱,为探索其如何适应冷水、迁入新栖息地以及如何进行可持续养殖管理提供了强有力的工具。
从水库渔获到完整遗传蓝图
研究人员首先在中国东北的一座大型水库采集了一条健康的日本泥鳅。他们从鱼的肌肉中小心提取出高质量DNA,然后使用了多种现代测序仪器,各有优势。有些能产生大量短而准确的DNA片段,而另一些则能读取可跨越复杂区域的很长片段。团队还获取了DNA在细胞内的三维包装信息,这有助于将片段按正确顺序排列,组成完整的染色体。

构建所有染色体的无缝图谱
研究者利用先进的计算方法,将原始的DNA读取拼接成长且连续的片段,并对其进行抛光以纠正剩余错误。他们使用3D包装信息对这些片段进行定位和定向,排列成28条类染色体结构,与相关泥鳅物种的已知情况相符。早期的该物种基因组版本包含近两百个缺口和更短的片段。相比之下,新组装覆盖大约5.26亿个碱基对且无缺失,大部分遗传物质位于非常长的、不被打断的片段中,能够从端到端覆盖整条染色体。
看到被隐藏的末端与中心
基因组研究中最难的一项是解析重复DNA,尤其是染色体的末端和中心。这些区域由许多几乎相同的序列组成,常在初稿基因组中留白。在本研究中,通过将长读段与专用工具包相结合,团队在全部28条染色体上鉴定出了染色体末端(端粒)和中心锚点(着丝粒)。他们绘制了56个端粒和28个着丝粒,并测量了它们长度的变异。此精细视图将为未来追踪染色体定位及其在细胞分裂过程中的行为的实验提供重要价值。

编目基因与重复序列
在获得连续基因组后,研究者进一步分析了其包含的内容。通过将鱼本身的RNA转录证据与与相关物种的比较相结合,他们预测出超过31,000个蛋白编码基因,并发现几乎所有基因都能在主要生物学数据库中找到匹配条目。他们还绘制了占基因组近40%的大量重复元件,特别是可以移动并重塑染色体的活动DNA片段。与早期组装相比,新图谱捕获了更多这些重复序列和此前缺失的独特区域,同时总体错误率并未增加。
冷水适应研究的新参考
为检验质量,团队检查了不同测序数据集和基因组注释如何比对回新基因组,并将其与之前的最佳版本做了比较。新图谱显示出更高的完整性、每条染色体上更平滑的覆盖以及对基因预测的更好支持。对非专业读者来说,这意味着科学家们现在拥有了日本泥鳅遗传说明书的清晰、几乎逐页的副本。该参考将为研究鱼类的繁殖、对温度变化的应对、向新湖泊的扩散以及如何在变暖的世界中更有效地培育和管理提供基础。
引用: Zhou, Y., Fang, D., You, Y. et al. A telomere-to-telomere reference genome assembly of the Hypomesus nipponensis. Sci Data 13, 755 (2026). https://doi.org/10.1038/s41597-026-07078-6
关键词: 日本泥鳅基因组, 端粒到端粒组装, 冷水鱼遗传学, 染色体定位, 水产养殖基因组学