Clear Sky Science · fr

Assemblages du génome au niveau des chromosomes de Nicotiana attenuata (coyote tobacco) et Nicotiana obtusifolia (desert tobacco)

· Retour à l’index

Pourquoi les génomes de tabac sauvage comptent

Les parents sauvages des cultures recèlent souvent des secrets génétiques qui les aident à survivre à la chaleur, à la sécheresse, aux insectes et aux maladies. Cette étude ouvre les livres d’instructions ADN de deux de ces plantes — le tabac coyote et le tabac du désert — avec un niveau de détail sans précédent. En construisant des cartes chromosomiques quasiment sans lacunes, le travail fournit aux biologistes une référence puissante pour comprendre comment ces plantes produisent des défenses chimiques puissantes comme la nicotine et comment elles font face à la vie dans des environnements rudes.

Des plantes désertiques aux plans numériques

Le tabac coyote (Nicotiana attenuata) et le tabac du désert (Nicotiana obtusifolia) poussent à l’état naturel dans les déserts et les canyons du sud-ouest américain. Pendant des années, ils ont servi d’espèces modèles pour étudier comment les plantes interagissent avec les herbivores, les microbes et les pollinisateurs. Les tentatives antérieures de lecture de leurs génomes n’avaient produit que des esquisses : l’ADN était fragmenté en milliers de morceaux, avec de nombreuses lacunes et jonctions incertaines. Ce niveau de qualité suffisait pour certaines questions, mais rendait difficile la comparaison des gènes entre espèces ou l’identification des origines de nouvelles molécules de défense.

Figure 1
Figure 1.

Construire des chromosomes avec de nouveaux outils de séquençage

Les auteurs ont réexaminé ces tabacs sauvages en utilisant des technologies ADN modernes conçues pour assembler des génomes très grands et répétitifs. Pour le tabac coyote, ils sont partis d’un assemblage précédent en lectures longues et y ont ajouté des données « Hi-C », qui capturent la façon dont des régions éloignées de l’ADN se trouvent physiquement côte à côte à l’intérieur du noyau cellulaire. Ces contacts physiques servent d’indices sur les fragments qui appartiennent au même chromosome et sur leur ordre. À l’aide de logiciels spécialisés, ils ont regroupé, ordonné et orienté les morceaux d’ADN en 12 chromosomes de longueur complète, couvrant presque la totalité du génome de la plante d’environ 2,2 milliards de lettres.

Carte de novo du tabac du désert

Pour le tabac du désert, l’équipe a construit le génome presque à partir de zéro. Ils ont généré des lectures longues d’ADN très précises sur un séquenceur PacBio et assemblé celles-ci en plusieurs centaines de segments longs. Puis, comme pour le tabac coyote, ils ont utilisé les motifs de contacts Hi-C pour coudre ces segments en 12 chromosomes totalisant environ 1,3 milliard de lettres d’ADN. Des contrôles supplémentaires ont permis d’éliminer les fragments errants provenant de microbes ou d’autres contaminants, laissant une représentation propre et compacte du matériel génétique de la plante.

Trouver les gènes au milieu d’océans de répétitions

Les deux génomes se sont avérés dominés par de l’ADN répétitif, qui représente environ quatre cinquièmes de leur longueur et est notoirement difficile à assembler. La nouvelle stratégie combinant lectures longues et Hi-C a bien géré cette complexité, permettant aux chercheurs d’identifier plus de 35 000 gènes codant pour des protéines dans le tabac coyote et plus de 27 000 dans le tabac du désert. Ils ont combiné des preuves issues des ARN produits dans différents tissus et de espèces apparentées de la famille des solanacées pour affiner les prédictions de gènes. Des tests de qualité indépendants ont montré que presque tous les gènes végétaux de base attendus sont présents et intacts, et que les longs éléments répétitifs sont correctement représentés — des signes distinctifs de génomes de qualité référence.

Figure 2
Figure 2.

Une base pour étudier les défenses des plantes

Pour confirmer que les assemblages sont fiables, l’équipe a examiné plusieurs types de preuves : des cartes de contacts Hi-C qui s’alignent proprement le long des diagonales chromosomiques, des mesures statistiques de la précision des bases, et des scores de complétude standardisés atteignant des niveaux typiques des meilleurs génomes végétaux. Avec ces plans ADN robustes désormais disponibles dans des bases de données publiques, les chercheurs peuvent plus facilement retracer comment la nicotine et d’autres composés spécialisés ont évolué, comparer les réseaux de gènes contrôlant les batailles plante–insecte, et explorer pourquoi des espèces étroitement apparentées réagissent différemment au stress environnemental. En termes simples, cette étude transforme deux images génétiques auparavant floues en vues nettes et pleine page, créant une base pour de futures découvertes en écologie végétale, en évolution et en amélioration des cultures.

Citation: Chakraborty, A., Xu, S. Chromosome-level genome assemblies of Nicotiana attenuata (coyote tobacco) and Nicotiana obtusifolia (desert tobacco). Sci Data 13, 441 (2026). https://doi.org/10.1038/s41597-026-07080-y

Mots-clés: génomes de tabac sauvage, défenses chimiques des plantes, assemblage au niveau des chromosomes, génétique des Solanacées, séquençage Hi-C