Clear Sky Science · zh

水巨蜥(Varanus salvator)的染色体级基因组组装与注释

· 返回目录

一只藏着故事的巨型蜥蜴

水巨蜥是一种在热带亚洲的河流与湿地巡游的强壮爬行动物,它不仅令人印象深刻,而且是生态系统中的重要成员,同时面临栖息地丧失与贸易带来的压力。为了理解这种生物如何既能适应水中又能适应陆地生活,并更好地保护它,科学家们现在已将其 DNA 解析到令人瞩目的细致程度。这项工作产生了一个完整的、染色体级的遗传蓝图,将帮助研究人员探究体型、行为与抗逆性在爬行动物中的演化机制,以及如何最好地保护它们。

这只蜥蜴为何重要

巨蜥属作为一个群体在生物学上颇为特殊:有些物种小到小于人手,而另一些,如科莫多巨蜥,则可与人类相匹敌。由于这些动物都属于同一属,它们构成了研究极端体型和生活方式如何出现的天然试验场。水巨蜥位于这一体型谱的较大端,分布从中国与印度延伸到印度尼西亚和斯里兰卡。它们在河流、湖泊和沼泽周围繁盛,食物范围从蜗牛与螃蟹到鱼类与腐肉不等,有助于控制猎物种群并在食物网中循环营养物质。同时,包括水巨蜥在内的许多巨蜥物种被猎捕或参与国际贸易,并被列入保护协议,因此可靠的科学数据对管理决策至关重要。

Figure 1
Figure 1.

构建完整的遗传蓝图

迄今为止,只有少数巨蜥物种的基因组被拼接出来,而且大多数基因组是不完整的或被分割成许多小片段。本研究团队旨在为水巨蜥改变这一状况,采用了多种前沿测序方法的组合。他们从一头自然死亡的成年雄性采集组织,并从若干器官提取了 DNA 和 RNA。研究中既生成了短而高准确度的 DNA 片段,也生成了很长但精确度较低的读序列,并获得了记录基因组不同部分在细胞内如何物理连接的特殊数据。通过将这些互补的数据类型编织在一起,研究人员能够把蜥蜴的基因组组装成与其真实染色体相匹配的长片段。

从原始数据到染色体

科学家们首先通过分析短读数据中小 DNA 模式(称为 k-mer)出现的频率来估计基因组的大小与复杂性。随后他们使用长读构建初步的较大 DNA 片段,利用更为准确的短读纠正错误,并借助一种能标记来自同一原始 DNA 分子的读序列的技术信息将这些片段连接成更大的支架(scaffold)。最后,他们应用了一种称为 Hi-C 的方法,该方法记录基因组哪些部分在细胞核中彼此接近,从而将这些支架排列成 20 条拟染色体。近乎全部组装的 DNA——约 97%——都能被放置到这些类染色体结构上,研究团队通过与一种相关的巨蜥物种比较,识别出其中一条为 Z 性染色体。

Figure 2
Figure 2.

基因组包含了什么

最终完成的基因组约包含 16.4 亿个 DNA 碱基,在用标准的脊椎动物保守基因集合进行检验时显示出很高的完整性。大约三分之一的基因组由重复元件组成,例如能够迁移的 DNA 序列,这些成分被认为会塑造基因组的演化。通过计算机预测、与其他爬行动物的比对以及来自该蜥蜴自身 RNA 的证据相结合,研究人员鉴定出超过 19,000 个蛋白质编码基因和 3,000 多个非编码 RNA 基因。几乎所有的蛋白质编码基因都能在公共数据库中找到已知功能的对应项,这表明该组装既准确又信息量丰富。包括原始测序读取回映率以及基因组碱基组成分布是否均匀等额外测试,进一步支持了该参考基因组的高质量。

用于进化与保护的新工具

对非专业读者而言,这项工作的关键成果是创建了一个可靠的、近乎完整的水巨蜥遗传指令图谱。有了这张图谱,科学家们现在可以研究哪些基因支撑了该属显著的体型差异,这些爬行动物如何适应不同气候与栖息地,以及在人人类压力下它们的种群如何变化。保护规划者也可以利用该基因组监测遗传多样性、追踪非法贸易并设计更有效的保护策略。简言之,这一染色体水平的基因组把水巨蜥从一个神秘的河流巨兽变成了一个被良好描绘的物种,为进化学、生态学和野生动物保护方面的发现打开了大门。

引用: Du, Y., Zhu, XM., Yao, YT. et al. Chromosome-scale genome assembly and annotation of the water monitor lizard, Varanus salvator. Sci Data 13, 594 (2026). https://doi.org/10.1038/s41597-026-06985-y

关键词: 水巨蜥, 基因组组装, 爬行动物进化, 保护遗传学, 染色体级DNA