Clear Sky Science · zh
利用直系同源信息与生成式建模的跨物种基因重设计
为何跨物种重设计基因至关重要
现代生物技术经常需要将基因从一种微生物移入另一种,以制造药物、酶或环境修复工具。然而,在原始宿主中表现良好的基因在新宿主中可能表现不佳,产生的蛋白质寥寥无几。本文介绍了一种新的人工智能系统 OrthologTransformer,它从进化本身学习,将基因改写为在另一物种中看起来“本地化”的序列,从而提升其性能并为绿色技术与工业应用开辟新可能。
当前基因调优方法的局限
几十年来,科学家们依赖一种称为密码子优化的策略来帮助外源基因在新宿主中发挥作用。其思路很简单:遗传密码有多个三联“密码子”可以编码相同的氨基酸,而不同物种偏好不同的密码子。传统工具将稀有密码子替换为偏好密码子,但不改变蛋白质的氨基酸序列。这通常有效,但忽视了影响基因表现的许多其他特征,如 RNA 折叠、调控信号和蛋白质产生的时序。在某些情况下,过度优化密码子反而会损害蛋白产量。相比之下,自然在跨物种适应方面采用更丰富的策略:不同物种中同源的基因(称为直系同源基因)通常同时表现为氨基酸的替换、小的插入或缺失以及密码子的更换,且仍能保留整体功能。
学习自然的基因改写手册
OrthologTransformer 将基因重设计视为一种语言翻译:给定来自一种细菌的 DNA 序列,它“翻译”出该基因在另一物种中可能的样子。该模型基于现代语言工具使用的 Transformer 架构,但这里以密码子而非单词为操作单元。它在来自两千多种细菌的数百万对自然配对直系同源基因上进行训练,并使用特殊标记指示转换的源物种和目标物种。通过观察进化如何在功能与宿主适应间取得平衡,系统学会了何时简单的密码子替换足够,何时可接受精细的氨基酸变化或长度调整。在涵盖45种细菌和数百个源—目标组合的测试中,AI 重设计的基因在外观上比传统密码子优化和一种领先的神经网络密码子优化器更接近目标物种的本地同源基因,同时在蛋白水平上仍保持高度相似。 
将 AI 设计的可降解塑料酶付诸实践
为证明这不仅是计算技巧,研究团队聚焦于 PETase——来自 Ideonella sakaiensis 的一种能降解 PET 塑料(大多数饮料瓶的材料)的酶。Ideonella 生长缓慢,不适合工业用途,因此研究者让 OrthologTransformer 将 PETase 基因为生长更快的宿主枯草芽孢杆菌(Bacillus subtilis)改写。他们生成了十二个重设计基因变体,探索不同的训练设置以及一种额外的搜索程序,该程序将序列轻推向更接近枯草芽孢杆菌的 DNA 组成和有利的 RNA 结构。尽管某些变体携带了大量 DNA 变化和少数氨基酸替换,计算模型预测酶的核心三维形状得到保留。当这些设计在活的枯草芽孢杆菌细胞中构建并测试时,若干变体产生了大量分泌的 PETase,且全部显示出可测的降解塑料活性。
一种性能超越标准优化的 AI 设计
其中一条名为 AI-L2 的 AI 设计序列尤为突出。携带该基因的枯草芽孢杆菌分泌的 PETase 特别多,在为期七天的测试中,其产生的塑料降解产物大约比其他菌株多三倍,并且在按反应产物计量时大约比典型的密码子优化对照多十倍。暴露于 AI-L2 细胞的 PET 薄膜的显微图像显示出深深的坑洞和空洞,塑料被侵蚀得更为显著,远超过其他条件。详尽的酶学测试表明,AI-L2 版本的 PETase 不仅产生效率更高,而且对其底物的处理速度更快,赋予其比原始和密码子优化酶更高的催化效率。与之并行的在大肠埃希氏菌(Escherichia coli)中的实验显示,即便 OrthologTransformer 设计的 PETase 仅改变了密码子使用而未改变氨基酸序列,它仍然优于基于频率的密码子优化基因,这凸显了模型捕捉到传统方法遗漏的细微、宿主特异性偏好。
这对未来生物学与技术意味什么
通俗地说,OrthologTransformer 像一位专家级翻译者,不仅为新微生物改写基因的“拼写”,还在认为安全或有利时对“句子”本身做出小幅、以进化为依据的编辑。通过直接从数千种细菌中基因如何自然适应这一事实学习,它能够提出在新宿主中比仅限于密码子替换的设计更有效的改写 DNA。成功在枯草芽孢杆菌中创造出更强效的可降解塑料酶表明,这类 AI 指导的基因重设计有望加速工业生物催化剂、环境修复微生物的开发,甚至最终促进医疗基因治疗的发展,帮助生物体像读取自身基因一样识别和利用外来基因。
引用: Akiyama, M., Tashiro, M., Huang, Y. et al. Cross-species gene redesign leveraging ortholog information and generative modeling. Nat Commun 17, 2120 (2026). https://doi.org/10.1038/s41467-026-69966-0
关键词: 基因重设计, 合成生物学, 直系同源基因, 生物技术中的人工智能, 降解塑料的酶