Clear Sky Science · zh
矮胸鳅属鱼Gymnodiptychus pachycheilus的染色体级基因组组装与注释
来自世界屋脊的鱼类故事
在青海—西藏高原的高处,江河穿行于稀薄的空气与冰冷的景观之间,但有一类鱼仍能在这里繁衍生息。其中一种——矮胸鳅Gymnodiptychus pachycheilus尤为特殊:它几乎没有鳞。在这项研究中,研究人员解读了该鱼的全套遗传蓝图,达到了染色体级别的解析。该工作建立了一个详尽的DNA参考图谱,为理解生命如何适应极端高海拔与寒冷,以及这种奇特、近乎无鳞的体形如何演化,打开了大门。
裸皮的河流之鱼
矮胸鳅属属于称为鳅形鲤科(schizothoracine)的鲤形目鱼类,主要生活在高原河流中。随高原抬升,这些鱼在漫长的时间里发生了多样化,出现了一个显著的演化模式:越是“进化派生” 的群体,体鳞、须以及特殊的喉齿越趋缩小或消失。分布于中国黄河与雅砻江上游的G. pachycheilus便是代表性个体。其体表几乎完全裸露,仅在肩部和肛门附近保留少量不规则的鳞列。这种极端的形态,使其成为研究严酷环境与进化史如何铭刻于DNA的理想自然试验材料。
为何读取整个基因组至关重要
鳅形鲤科鱼类在遗传上十分复杂。它们具有多倍体,即携带额外的染色体组——通常是四套而非通常的两套。不同物种的染色体数量可从66到超过400不等。在全基因组复制之后,各谱系会通过称为再二倍化(rediploidization)的过程逐渐“稳定”下来,期间染色体发生重排,一些基因副本丢失,另一些则获得新功能或更强的作用。这些变化可驱动适应与形态多样性,但要追溯这些过程,科学家需要关键物种的准确、近完整的基因组图谱。此前G. pachycheilus尚无染色体级参考,这限制了将其异常外表与高海拔生活方式与基因联系起来的能力。

拼接基因组拼图
为构建这样的图谱,团队结合了几种强有力的测序方法。他们采集了来自雅砻江的一尾野生个体,从其肌肉组织中提取高质量DNA。用Illumina测序获得短片段读序,用PacBio HiFi技术获得长且高准确度的序列片段,并用Hi-C数据捕捉基因组在细胞核内不同区域的空间接近关系。通过分层整合这些数据,研究者先组装出长的连续DNA片段,随后将其排列为25条拟染色体——这些“虚拟染色体”代表真实染色体的组织方式。最终组装约含18.3亿个DNA碱基,总体具有很长的不间断片段,并在以鱼类标准基因集进行评估时显示约98%的完整性。
基因组包含了什么
在基本结构确定后,科学家们进一步探究了组成这些序列的内容。近一半的基因组——约48%——由重复序列构成,其中许多是可移动的DNA片段,如DNA转座子和长末端重复(LTR)逆转录转座子。这些重复序列影响基因组大小与结构。通过计算预测、与其他鱼类基因组的比对以及来自11种不同组织的RNA测序数据,团队鉴定出48,952个蛋白编码基因。其中超过92%的基因可在主要国际数据库中匹配到已知或预测的功能。他们还编目了数以万计的非编码RNA,包括转运RNA、核糖体RNA和小型调控RNA,这些分子参与调控基因的表达。

为未来发现奠定基础
作者尚未确切指出导致G. pachycheilus近乎无鳞或适应高海拔的具体DNA变异。相反,他们提供了高质量的参考资源,供其他研究者去深入这些问题。通过在公共数据库中共享所有原始测序数据、最终基因组与详细的基因注释,该研究创建了一个生物学家可共同使用的资源。借助它,研究者现在可以将G. pachycheilus与其他高原鱼类进行比较,追踪在基因组复制后哪些基因被保留、丢失或重新利用,并寻找极端环境生存与非凡体型在“世界屋脊”上的遗传根源。
引用: Gao, K., Lei, C., Lin, X. et al. Chromosome-level genome assembly and annotation of the schizothoracine fish Gymnodiptychus pachycheilus. Sci Data 13, 661 (2026). https://doi.org/10.1038/s41597-026-07037-1
关键词: 高原鱼类, 基因组组装, 多倍体, 青藏高原, 适应性进化