Clear Sky Science · ru
Прогнозирование кандидатов генов FOX для оксического нитрогенфикса с помощью мультииомного машинного обучения и сравнительной биоинформатики
Почему превращение воздуха в питательные вещества для растений имеет значение
Современное сельское хозяйство сильно зависит от промышленного удобрения, которое получают, переводя азот из воздуха в усвояемую форму с помощью огромного количества ископаемого топлива. Этот процесс кормит миллиарды людей, но также способствует выбросам парниковых газов и загрязнению вод. В природе, однако, некоторые микроорганизмы тихо выполняют ту же химическую операцию, используя солнечный свет и заметно меньше энергии. В этой работе исследуется, как расшифровать и каталогизировать гены, которые позволяют одному такому микроорганизму — цианобактерии — фиксировать азот даже при одновременном выделении кислорода, что обычно разрушает этот процесс. Понимание этих генов может указать путь к созданию культур и промышленных микробов, которые сами удобряют почву.
Тонкое равновесие внутри крошечной клетки
Азотный газ составляет большую часть воздуха, но растения и животные не могут использовать его напрямую. Специализированные микроорганизмы полагаются на фермент азотазу (нитрогеназу), чтобы превратить азотный газ в аммиак — форму, доступную для жизни. Нитрогеназа чрезвычайно чувствительна к кислороду, который её разрушает. Тем не менее некоторые цианобактерии, включая вид Anabaena 7120, совмещают кислородопродуцирующий фотосинтез и фиксацию азота в одной нити. Они достигают этого, формируя специальные клетки — гетероцисты, которые поддерживают низкооксигенное окружение для нитрогеназы. Помимо основных генов нитрогеназы требуется множество вспомогательных генов для построения защитных оболочек клеток, контроля внутренней химии и переброски электронов и питательных веществ. Гены, утрата которых препятствует росту на атмосферном азоте в присутствии кислорода, называют FOX-генами, и в настоящее время известна только часть из них.

Обучение компьютеров находить отсутствующие азотные гены
Авторы поставили задачу предсказать новые кандидаты FOX-генов по всему геному Anabaena 7120, используя сочетание биологических измерений и машинного обучения. Они собрали «мультииомный» набор данных, который отслеживал реакцию каждого гена после удаления соединённого азота из среды — триггера, вызывающего образование гетероцист. В набор вошли временные измерения уровней РНК, изменения в количестве белков, характеристики ДНК-регионов, управляющих транскрипцией, физическое соседство каждого гена на хромосоме и степень сохранности гена у других фиксирующих и нефирующих азот цианобактерий. Затем исследователи пометили 68 генов, уже доказанно относящихся к FOX, и выбрали 835 широко сохранённых, несущественных генов в качестве замены для группы не‑FOX.
Насколько хорошо работали модели и что они выяснили
Используя эти размеченные примеры, команда обучила три типа моделей — логистическую регрессию, Random Forest и XGBoost — и многократно тестировала их на отложенных генах. Все три модели надёжно ранжировали известные FOX-гены выше прокси‑не‑FOX генов, при этом лучшие модели достигали показателей, сравнимых с другими предикторами генетической существенности. Важно, что модели не были «чёрными ящиками»: исследователи применили метод SHAP, чтобы увидеть, какие признаки склоняют предсказание гена в сторону или против FOX‑типа. FOX-гены, как правило, сильно включаются поздно после удаления азота, показывают низкую активность до переключения, встречаются в кластерах с другими генами, связанными с азотфиксацией, и более сохранены у известных нитрогенфиксаторов, чем у близкородственных видов, не фиксирующих азот. Напротив, гены, часто общие с нефиксирующими цианобактериями или расположенные в определённых промотерных конфигурациях, характерных для «домашних» функций, с меньшей вероятностью были FOX.
Новые кандидатные гены и инструмент для инженеров
Опираясь на эти выводы, авторы вычислили вероятностные оценки для каждого гена в геноме, используя их как ранг, а не буквальные шансы. Среди кандидатов с наивысшими рейтингами оказались гены, расположенные в области оболочки гетероцисты, гены, связанные с редокс‑балансом и переносом электронов, а также несколько факторов, известных в других организмах как помогающие собирать или поддерживать нитрогеназу, но ещё не классифицированных как FOX в Anabaena. Некоторые из топовых генов уже имеют независимые экспериментальные свидетельства важности, что придаёт подходу доверия. Чтобы сделать результаты практичными для синтетической биологии, команда также создала веб‑инструмент, который помогает пользователям выбирать компактные наборы кандидатных генов, укладывающиеся в заданный предел размера ДНК — примерно на том уровне, который уже переносили в другие цианобактерии — используя либо простое ранжирование, либо ориентированную на размер жадную стратегию.

От более умных предсказаний к более умным культурам
Для широкого читателя ключевое сообщение в том, что эта работа превращает разрозненный, геномный поиск в сосредоточенный шорт‑лист вероятных участников, которые позволяют кислородопродуцирующим микроорганизмам по‑прежнему фиксировать азот. Исследование показывает, что закономерности включения генов во времени, их встраивание в соседство и то, какие виды сохраняют или теряют эти гены вместе, формируют узнаваемый подпись оксической фиксации азота. Хотя каждый кандидат ещё требует экспериментальной проверки, ранжированные списки и интерактивное приложение дают исследователям дорожную карту для систематического заполнения недостающих звеньев. В долгосрочной перспективе эта дорожная карта может направить усилия по оснащению сельхозкультур или промышленных микробов надёжными, автономными системами фиксации азота, снижая зависимость от энергоёмких заводов по производству удобрений и помогая сельскому хозяйству действовать более щадяще по отношению к планете.
Цитирование: Young, J., Gu, L. & Zhou, R. Predicting FOX gene candidates for oxic nitrogen fixation using multi-omic machine learning and comparative bioinformatics. Sci Rep 16, 11412 (2026). https://doi.org/10.1038/s41598-026-41873-w
Ключевые слова: фиксация азота, цианобактерии, машинное обучение, синтетическая биология, гетероцист