Clear Sky Science · fr
Prédiction de gènes candidats FOX pour la fixation d'azote en conditions oxiques par apprentissage automatique multi-omique et bioinformatique comparative
Pourquoi transformer l'air en nourriture pour les plantes est important
L'agriculture moderne dépend fortement des engrais industriels, produits en convertissant l'azote de l'air en une forme utilisable au prix d'une énorme consommation d'énergies fossiles. Ce procédé nourrit des milliards de personnes mais alimente aussi les émissions climatiques et la pollution de l'eau. Dans la nature, cependant, certains micro-organismes accomplissent la même transformation chimique en utilisant la lumière et bien moins d'énergie. Cet article explore comment décoder et répertorier les gènes qui permettent à l'un de ces micro-organismes, une cyanobactérie, de fixer l'azote tout en produisant de l'oxygène — une situation qui, en général, inhibe cette chimie. Comprendre ces gènes pourrait indiquer des pistes pour des cultures ou des microbes industriels capables de s'engraisser eux-mêmes.
L'équilibre à l'intérieur d'une minuscule cellule
Le gaz d'azote constitue la majeure partie de l'air, mais les plantes et les animaux ne peuvent pas l'utiliser directement. Des microbes spécialisés s'appuient sur une enzyme appelée nitrogenase pour convertir l'azote gazeux en ammoniac, une forme assimilable par le vivant. La nitrogenase est extrêmement sensible à l'oxygène, qui la détruit. Pourtant certaines cyanobactéries, dont l'espèce Anabaena 7120, réalisent à la fois la photosynthèse productrice d'oxygène et la fixation de l'azote au sein du même filament. Elles y parviennent en formant des cellules spéciales appelées hétérocystes qui maintiennent un environnement pauvre en oxygène pour la nitrogenase. Outre les gènes essentiels de la nitrogenase, de nombreux gènes accessoires sont nécessaires pour construire des parois cellulaires protectrices, contrôler la chimie interne et gérer le flux d'électrons et de nutriments. Les gènes dont la perte empêche la croissance sur l'azote gazeux en présence d'oxygène sont appelés gènes FOX, et seule une fraction d'entre eux est actuellement connue.

Apprendre aux ordinateurs à repérer les gènes manquants pour l'azote
Les auteurs se sont donné pour objectif de prédire de nouveaux candidats gènes FOX sur l'ensemble du génome d'Anabaena 7120 en combinant mesures biologiques et apprentissage automatique. Ils ont assemblé un jeu de données « multi-omique » suivant la réponse de chaque gène lors du retrait d'azote combiné du milieu de culture, stimulus qui déclenche la formation d'hétérocystes. Cela comprenait des séries temporelles des niveaux d'ARN, des variations d'abondance protéique, des caractéristiques des régions régulatrices de l'ADN qui pilotent la transcription, le voisinage physique de chaque gène sur le chromosome et le degré de conservation de chaque gène chez d'autres cyanobactéries fixatrices d'azote versus non fixatrices. Ils ont ensuite étiqueté 68 gènes déjà démontrés comme FOX et choisi 835 gènes largement conservés et non essentiels comme substitut du groupe non-FOX.
Performance des modèles et enseignements tirés
À partir de ces exemples étiquetés, l'équipe a entraîné trois types de modèles — régression logistique, Random Forest et XGBoost — et les a testés de manière répétée sur des gènes mis de côté. Les trois modèles ont su classer de manière fiable les gènes FOX connus au-dessus des gènes proxy non-FOX, les meilleurs atteignant des performances comparables à d'autres prédicteurs d'essentialité génique. Fait important, les modèles n'étaient pas des boîtes noires : les chercheurs ont utilisé une technique appelée SHAP pour identifier les caractéristiques qui poussaient une prédiction vers ou contre un profil de type FOX. Les gènes FOX avaient tendance à être fortement activés tardivement après le retrait de l'azote, montraient une faible activité avant l'activation, apparaissaient en grappes avec d'autres gènes de diazotrophie et étaient davantage conservés chez les fixateurs d'azote connus que chez des espèces étroitement liées ne fixant pas l'azote. En revanche, les gènes largement partagés avec des cyanobactéries non fixatrices, ou arrangés dans certains agencements de promoteurs associés à des fonctions ménagères, étaient moins susceptibles d'être des FOX.
Nouveaux candidats géniques et outil de conception pour ingénieurs
Fortes de ces connaissances, les auteurs ont attribué des scores de probabilité à chaque gène du génome, les utilisant comme un classement plutôt que comme de strictes probabilités numériques. Parmi les candidats les mieux classés figuraient des gènes intégrés dans la région de l'enveloppe des hétérocystes, des gènes liés à l'équilibre redox et au transport d'électrons, ainsi que plusieurs facteurs connus chez d'autres organismes pour aider à assembler ou soutenir la nitrogenase mais non encore classifiés comme FOX chez Anabaena. Certains des gènes les mieux notés présentent déjà des indices expérimentaux indépendants d'importance, ce qui renforce la crédibilité de l'approche. Pour rendre les résultats utiles en biologie synthétique, l'équipe a également développé un outil web qui aide les utilisateurs à sélectionner des ensembles compacts de gènes candidats correspondant à une taille d'ADN choisie — à peu près l'échelle déjà transférée dans d'autres cyanobactéries — en utilisant soit un ordre de classement simple, soit une stratégie gloutonne prenant en compte la taille.

De meilleures prédictions à des cultures plus intelligentes
Pour le lecteur non spécialiste, le message clé est que ce travail transforme une recherche brouillonne à l'échelle du génome en une courte liste ciblée d'acteurs probables permettant à des microbes producteurs d'oxygène de fixer malgré tout l'azote. L'étude montre que des motifs dans le moment d'activation des gènes, leur enchevêtrement avec leurs voisins et les espèces qui les conservent ou les perdent ensemble forment une signature reconnaissable de la fixation d'azote en conditions oxiques. Si chaque candidat nécessite encore une validation expérimentale, les listes classées et l'application interactive offrent aux chercheurs une feuille de route pour combler systématiquement les pièces manquantes. À long terme, cette feuille de route pourrait guider les efforts pour doter les cultures ou les microbes industriels de systèmes de fixation d'azote robustes et autonomes, réduisant la dépendance aux usines d'engrais énergivores et allégeant l'impact de l'agriculture sur la planète.
Citation: Young, J., Gu, L. & Zhou, R. Predicting FOX gene candidates for oxic nitrogen fixation using multi-omic machine learning and comparative bioinformatics. Sci Rep 16, 11412 (2026). https://doi.org/10.1038/s41598-026-41873-w
Mots-clés: fixation de l'azote, cyanobactéries, apprentissage automatique, biologie synthétique, hétérocyste