Clear Sky Science · zh
通向可靠且完整的药用植物基因组的漫长道路
为何植物DNA图谱与人类健康息息相关
今天许多最有效的药物——从抗癌药物紫杉醇到镇痛药吗啡以及抗疟药青蒿素——都来源于植物。然而对于大多数药用植物,科学家仍缺乏完整的DNA“使用手册”。这篇综述解释了新一代基因组技术如何改变我们阅读这些手册的能力、为什么现有的植物基因组常常仍不完整或存在缺陷,以及真正准确的基因组如何有望解锁更好的药物、更可持续的生产方式和有价值物种的改进保护。

读取药用植物蓝图的潜力
千百年来,人们依赖草药疗法,现代药理学也持续大量汲取植物天然产物。这些专门化分子——生物碱、萜类、酚类化合物及其他许多——由编码于植物DNA中的复杂代谢路径合成。直到近期,科学家还必须使用如同位素示踪和单基因克隆等缓慢且费力的工具来拼凑这些路径。廉价、高通量的DNA测序的出现改变了这一格局。截至2025年2月,已有431个药用植物(跨203个物种)的基因组被测序,为研究人员系统性地寻找途径基因、理解这些珍贵化合物如何被调控以及探究这些化学性状如何进化提供了手段。
测序热潮,但许多基因组不尽完善
来自PacBio和Oxford Nanopore的长读长测序技术,配合短读长的Illumina数据和如Hi‑C之类的染色体级定位方法,已显著提升植物基因组质量。近一半的药用植物拼装是在过去三年内发布的,并且大多数近期基因组已构建到染色体尺度。然而,综述显示数量已经超过了质量。超过半数的基因组仅存在初始版本,许多仍处于草稿级别,只有11种药用植物拥有“端粒到端粒”(T2T)无缝拼装,能完整捕获着丝粒和其他重复区。像N50(连续性指标)和BUSCO评分(保守基因完成度)这样的标准度量总体看起来令人鼓舞,但它们可能掩盖关键空缺,恰恰就在重要生物合成基因所在之处。
药物基因本应出现却隐匿的缺口
为测试当前基因组的实际效用,作者检验了九种研究充分的药用植物中已知并经实验验证的代谢途径基因。即便在一些染色体级拼装中,合成如人参皂苷的关键酶或云南艾(Artemisia annua)中青蒿素的关键酶,也可能完全缺失或仅被部分捕获。在其他情况中,基因存在于原始基因组序列中,但在官方基因注释中缺失或被截断,从而难以检索。一个显著例子来自产香豆素的药用草木防己(Peucedanum praeruptorum):一个较早的染色体级基因组破坏了一个关键基因并漏掉了另外两个;而新的T2T拼装不仅恢复了这些基因,还揭示出其中若干基因聚集在一个高度致密的生物合成基因簇中。这类基因簇图正是研究人员需要的,用以工程化植物或微生物更高效地生产药物。
为什么植物基因组如此难以拼装
药用植物带来的挑战超出许多农作物物种的常见问题。它们的基因组通常具有高度杂合性(每对染色体两份拷贝之间存在许多DNA差异)、频繁的多倍体性(多套染色体)和大量重复DNA——这些特征会混淆组装算法,导致断裂或错误连接。约三分之一被测序的药用植物基因组的重复含量超过70%,超过四分之一显示出非常高的杂合性。培育高度近交系或分离单倍体组织可以有所帮助,但对许多物种来说这既缓慢又昂贵,或在生物学上难以实现。将每个亲本单倍型分别组装的新策略以及针对重复丰富、多倍体基因组调优的更强大算法,开始缓解这些障碍,但尚未成为常规做法。

从基因组到新药物与未来方向
当基因组足够完善时,它们就会成为强大的发现引擎。研究人员可以将全基因组数据与转录组学、代谢组学和合成生物学相结合,精确定位酶、调控基因和控制高价值化合物生产的生物合成基因簇。这些见解已使得复杂植物途径的重建成为可能——例如长春新碱、紫杉醇及许多其他药物的途径已在酵母或模式植物中重构,为稳定、大规模生物制造开辟了道路。展望未来,作者主张从“每个物种一个粗略基因组”转向多个高质量的T2T和单倍型分辨的拼装,以捕捉种内多样性,类似作物研究中的泛基因组。将这些参考基因组与大规模重测序、先进表型测定以及新兴的单细胞和空间转录组学相结合,应能阐明环境、细胞类型与基因网络如何共同塑造药用化学性状。
这对患者与地球意味着什么
该综述的核心信息是:可靠且完整的药用植物基因组并非奢侈品;它们是将数百年的草药知识转化为精确现代治疗的基础。更好的基因组将帮助科学家发现药物途径中丢失的步骤,工程化更安全且更充足的关键药物供应,并识别能够产生相同化合物的替代物种。它们还将为受威胁药用植物的保护和可持续利用提供指导,而大多数此类物种目前仍缺乏任何基因组资源。简言之,准确绘制这些基因组的工作完成后,可能加速药物发现、稳定供应链并保护植物多样性——所有这些最终都将惠及人类健康。
引用: Cheng, LT., Wang, ZL., Zhu, QH. et al. A long road ahead to reliable and complete medicinal plant genomes. Nat Commun 16, 2150 (2025). https://doi.org/10.1038/s41467-025-57448-8
关键词: 药用植物基因组学, 生物合成基因簇, 端粒到端粒基因组, 天然产物生物合成, 合成生物学