Clear Sky Science · ru
Перепроектирование генов между видами с использованием информации об ортологах и генеративного моделирования
Почему важно перепроектирование генов между видами
Современной биотехнологии часто требуется переносить гены из одного микроорганизма в другой, чтобы получать лекарства, ферменты или инструменты для очистки окружающей среды. Однако ген, хорошо работающий в исходном микроорганизме, может почти не работать в новом хозяине и давать небольшой выход белка. В этой статье представлена новая система искусственного интеллекта, OrthologTransformer, которая учится у самой эволюции переписывать гены так, чтобы они выглядели «родными» для другого вида, повышая их эффективность и открывая новые возможности для экологичных технологий и промышленности.
Ограничения современных приёмов настройки генов
Десятилетиями учёные использовали стратегию, называемую оптимизацией кодонов, чтобы помочь чужеродным генам работать в новых хозяевах. Идея проста: генетический код имеет несколько трёхбуквенных «кодонов», кодирующих одну и ту же аминокислоту, и разные виды предпочитают разные кодоны. Традиционные инструменты заменяют редкие кодоны на предпочитаемые, не меняя при этом аминокислотную последовательность белка. Это часто помогает, но игнорирует многие другие важные факторы, влияющие на работу гена, такие как сворачивание РНК, регуляторные сигналы и временные аспекты синтеза белка. В некоторых случаях чрезмерная оптимизация кодонов может даже ухудшить выход белка. Природа же решает адаптацию между видами более разнообразно: родственные гены в разных видах, известные как ортологи, обычно демонстрируют изменения аминокислот, небольшие вставки и удаления, а также замену кодонов при сохранении общей функции.
Изучение «пособия» природы по переписыванию генов
OrthologTransformer рассматривает перепроектирование генов как своего рода переводчик языков: имея последовательность ДНК одного бактерия, он «переводит» её в то, как этот ген, скорее всего, выглядел бы в другом виде. Модель построена на архитектуре Transformer, используемой в современных языковых инструментах, но здесь она работает с кодонами вместо слов. Модель обучалась на миллионах естественно парных ортологичных генов более чем двух тысяч бактериальных видов, с особыми токенами, указывающими, из какого и в какой вид выполняется преобразование. Наблюдая, как эволюция уже уравновешивала сохранение функции и адаптацию к хозяину, система учится, когда достаточно простых замен кодонов, а когда допустимы тонкие изменения аминокислот или корректировки длины. В тестах, охватывающих 45 бактериальных видов и сотни пар источник–приёмник, переработанные моделью гены по сходству больше напоминали нативные ортологи целевого вида, чем результаты как традиционной оптимизации кодонов, так и ведущего нейронного оптимизатора кодонов, при этом сохраняя высокое сходство на уровне белка. 
Практическое применение ИИ‑спроектированных ферментов, поедающих пластик
Чтобы показать, что это не просто вычислительный трюк, команда сосредоточилась на PETase — ферменте из бактерии Ideonella sakaiensis, который способен разлагать PET‑пластик, материал большинства бутылок. Ideonella растёт медленно и не подходит для промышленного использования, поэтому исследователи попросили OrthologTransformer переписать ген PETase для быстророслого хозяина Bacillus subtilis. Они сгенерировали панель из двенадцати переработанных вариантов гена, исследуя разные настройки обучения и дополнительную процедуру поиска, подталкивающую последовательности к композиции ДНК, похожей на Bacillus, и к благоприятным структурам РНК. Несмотря на то что некоторые варианты содержали множество изменений в ДНК и несколько замен аминокислот, компьютерные модели предсказали сохранение ключевой трёхмерной формы фермента. Когда эти дизайны были собраны и протестированы в живых клетках Bacillus, несколько из них давали большое количество секретируемого PETase, и все показали измеримую активность по разложению пластика.
Дизайн от ИИ, превосходящий стандартную оптимизацию
Один из ИИ‑дизайнов, названный AI‑L2, выделился особенно. Клетки Bacillus с этим геном секретировали особенно большое количество PETase и за семидневный тест произвели примерно в три раза больше продуктов разложения пластика, чем любые другие штаммы, и около десяти раз больше по сравнению с типичными контролями с оптимизацией кодонов, если измерять по продуктам реакции. Микроскопические изображения плёнок PET, подвергнутых действию клеток AI‑L2, показали глубокие ямы и отверстия в пластике, куда тот был буквально «съеден», что было гораздо заметнее, чем в других условиях. Детальные ферментные тесты показали, что версия PETase AI‑L2 не только продуцировалась более эффективно, но и перерабатывала субстрат быстрее, обладая более высокой каталитической эффективностью по сравнению с оригиналом и оптимизированными кодонами версиями. Параллельный эксперимент в Escherichia coli показал, что версия PETase, спроектированная OrthologTransformer и изменившая лишь использование кодонов без изменения аминокислотной последовательности, всё же превзошла ген, оптимизированный на основе частот, подчёркивая, что модель улавливает тонкие, специфичные для хозяина предпочтения, которые традиционные методы упускают. 
Что это значит для будущей биологии и технологий
В повседневных терминах OrthologTransformer похож на экспертного переводчика, который не только переписывает «орфографию» гена для нового микроорганизма, но и вносит небольшие, продиктованные эволюцией правки в «предложение» самого гена, когда знает, что это безопасно или полезно. Обучаясь напрямую тому, как гены естественным образом адаптировались в тысячах бактериальных видов, он способен предлагать переработанную ДНК, которая работает в новых хозяевах лучше, чем дизайны, ограниченные заменой кодонов. Успешное создание более мощного фермента для разрушения пластика в Bacillus subtilis указывает на то, что такое ИИ‑руководимое перепроектирование генов может ускорить разработку промышленных биокатализаторов, микроорганизмов для очистки окружающей среды и в перспективе даже генных терапий, помогая организмам читать и использовать чужие гены так, как будто они свои.
Цитирование: Akiyama, M., Tashiro, M., Huang, Y. et al. Cross-species gene redesign leveraging ortholog information and generative modeling. Nat Commun 17, 2120 (2026). https://doi.org/10.1038/s41467-026-69966-0
Ключевые слова: перепроектирование генов, синтетическая биология, ортологичные гены, ИИ в биотехнологии, ферменты, разрушающие пластик