Clear Sky Science · zh

双斑蛐蛐(Gryllus bimaculatus,直翅目:蝈蝈科)的染色体级基因组装配

· 返回目录

为什么蛐蛐及其DNA很重要

蛐蛐看似简单的庭院昆虫,但在寻求可持续食物来源的过程中正变得日益重要。双斑蛐蛐(Gryllus bimaculatus)富含蛋白质,已被用作牲畜和宠物的饲料,并在某些地区作为人类食物。直到现在,科学家们还缺乏该物种详细的遗传“蓝图”,这限制了对其养殖改良、行为理解以及在气候变化背景下作为有弹性食物来源的潜力的探索。

Figure 1
Figure 1.

从蛐蛐养殖场到高端测序仪

研究团队首先从中国南部的受控繁殖室收集了双斑蛐蛐,该处对温度、光照和湿度进行精确管理。在仔细清除表面微生物后,他们提取了携带遗传信息的DNA和显示基因活性情况的RNA。随后,他们采用多种尖端测序技术以不同方式读取蛐蛐的基因密码:一种平台提供非常长的DNA读段,另一种提供短但高度准确的读段,还有专门的Hi-C数据可揭示哪些DNA片段在染色体内部彼此接近。总体上,他们生成了近5000亿个DNA碱基的数据——足以多次重读蛐蛐的整个基因组。

构建完整的遗传蓝图

将数十亿条原始DNA片段拼接成连贯的蛐蛐基因组图谱,就像在没有盒子图片的大型拼图游戏中组装拼图。研究人员使用专门的软件先拼接出长的DNA序列,然后去除因每只蛐蛐携带两套基因组而产生的额外重复片段。接着,他们利用Hi-C数据确定哪些片段属于同一条染色体以及它们的排列顺序,实际上将拼图折叠为15条大型染色体级片段。最终组装覆盖约16.6亿个DNA碱基——大约是人类基因组大小的一半——并具有令人印象深刻的长连续区段,表明这些片段高置信度地拼接在一起。

Figure 2
Figure 2.

蛐蛐基因组包含了什么

在完成基础图谱后,团队着手对其内容进行目录化。近42%的基因组由重复DNA元件构成,包括能复制并移动的活动序列以及较简单的短重复序列。在此背景之上,他们识别出14,457个蛋白质编码基因——这些基因指导蛐蛐的体构建与细胞运作。为确保预测可靠,科学家结合了蛐蛐自身的RNA证据、与果蝇和蜜蜂等其他昆虫已知基因的比较,以及大型蛋白质数据库的支持。超过80%的基因可连接到已知的家族、功能或细胞通路。他们还注释了超过8,000个非编码RNA,这些较小的遗传片段有助于控制基因的使用,而不是直接产生蛋白质。

对图谱质量的检测

只有高质量的基因组才能让其他研究者信任并在其基础上开展工作。因此,团队对其组装进行了多项独立检测。对DNA读段的统计分析表明,该序列既准确又完整,几乎所有在昆虫中预期存在的测试基因都已存在且正确组装。Hi-C互作图——一种显示细胞核内DNA相互作用的指纹图谱——在每条染色体上呈现出清晰连续的模式,表明大尺度结构是正确的。当他们将新的DNA和RNA读段比对回该基因组时,绝大多数读段都精确落在预期位置,进一步确认该图谱可靠地反映了蛐蛐的遗传物质。

这对食品和未来研究意味着什么

通过提供双斑蛐蛐的详细染色体级基因组,本研究为基础科学与实际应用创造了强大的资源。对科学家而言,它为探索蛐蛐如何感知化学物质、通过鸣声交流以及如何在基因层面适应环境打开了大门。对农业和粮食安全而言,它为培育在更少饲料下生长更好、耐高温或耐拥挤、或提供更稳定营养的蛐蛐奠定了基础。简言之,这一新的基因组图谱将Gryllus bimaculatus打造为现代遗传学模型,有助于把这种熟悉的鸣叫昆虫转变为可持续的食品与研究资源。

引用: Li, X., Wang, Y., Lu, C. et al. A chromosome-level genome assembly of two-spotted cricket, Gryllus bimaculatus (Orthoptera: Grylloidea). Sci Data 13, 690 (2026). https://doi.org/10.1038/s41597-026-06995-w

关键词: 蛐蛐基因组, 可食用昆虫, 可持续蛋白质, 染色体组装, 昆虫遗传学