Clear Sky Science · fr

Apprentissage profond et mécanismes d’attention pour identifier les gènes clés et leurs implications sur l’origine des ailes d’insectes

· Retour à l’index

Pourquoi les ailes d’insectes nous importent

Les insectes dominent la planète en nombre et en diversité, et leurs ailes expliquent en grande partie ce succès. Les ailes permettent aux insectes de se disperser, de trouver de la nourriture, d’échapper aux prédateurs et d’influencer des écosystèmes entiers. Pourtant, les origines de ces structures délicates restent débattues. Cette étude utilise des outils d’intelligence artificielle contemporains pour sonder l’ADN des insectes à la recherche d’indices, révélant un programme génétique partagé entre ailes et branchies qui éclaire l’origine des ailes.

Remonter aux mers anciennes

Pour comprendre les ailes d’insectes, les auteurs partent d’une idée simple : les insectes actuels ont probablement évolué à partir d’animaux ressemblant à des crustacés qui vivaient en milieu aquatique et respiraient par des branchies. D’autres hypothèses proposent que les ailes dérivent d’organes respiratoires semblables à des branchies, de plaques dorsales ou de lobes latéraux du thorax, et certaines recherches suggèrent une origine mixte. Si les ailes proviennent réellement des branchies, des gènes clés devraient montrer une activité similaire dans les ailes d’insectes et dans les branchies d’espèces aquatiques apparentées. Plutôt que d’examiner quelques gènes à la fois, l’équipe a donc scanné l’ensemble des jeux de protéines de nombreuses espèces pour déceler des motifs cachés associés aux ailes.

Figure 1. Des anciennes branchies aux ailes volantes : l’IA retrace le plan génétique commun à travers les espèces.
Figure 1. Des anciennes branchies aux ailes volantes : l’IA retrace le plan génétique commun à travers les espèces.

Apprendre à un réseau neuronal à « lire » les gènes

Les chercheurs ont construit un système d’apprentissage profond qu’ils nomment DeepWG pour distinguer les protéines d’espèces ailées et non ailées. Ils ont rassemblé les protéomes de 119 espèces, incluant des insectes et leurs proches parents, en ne conservant que des données de haute qualité. Chaque séquence protéique a été découpée en courts blocs de trois lettres, à la manière de la découpe de phrases en fragments de mots. Ces fragments ont été convertis en vecteurs numériques à l’aide de techniques empruntées au traitement du langage, puis injectés dans un réseau à mémoire bidirectionnelle doté d’une couche d’attention. Ce dispositif permet au modèle d’analyser les séquences protéiques dans les deux sens et de se focaliser sur les régions les plus informatives sans règles manuelles prédéfinies.

Identifier les gènes dont dépendent les ailes

DeepWG s’est montré très précis, classant correctement les échantillons de test plus de 97 % du temps et surpassant des réseaux neuronaux plus simples. La couche d’attention attribue un poids à chaque famille de gènes apparentés, mettant en évidence celles qui importent le plus pour distinguer espèces ailées et non ailées. Parmi près de 28 000 familles de gènes, les 5 % les mieux pondérés ont produit 3 872 gènes candidats, incluant de nombreux gènes déjà connus pour façonner les ailes des insectes. On y trouve des exemples célèbres contrôlant la croissance, le patron de développement et la taille des ailes, ainsi que des voies qui régulent la division cellulaire et la réponse aux signaux. L’analyse en réseau de l’activité génique a regroupé beaucoup de ces gènes en modules étroitement liés au développement des ailes chez la mouche drosophile, renforçant la confiance que DeepWG identifie des acteurs pertinents plutôt que du bruit aléatoire.

Figure 2. Comment un réseau neuronal filtre les séquences géniques pour séparer pas à pas les gènes liés aux ailes des autres gènes.
Figure 2. Comment un réseau neuronal filtre les séquences géniques pour séparer pas à pas les gènes liés aux ailes des autres gènes.

Ailes et branchies chantant la même mélodie

Le test le plus marquant a consisté à comparer le comportement de ces gènes clés à travers espèces et tissus. L’équipe a examiné la mouche drosophile, une éphémère présentant à la fois des bourgeons d’ailes et des branchies aquatiques, et un crustacé ressemblant à une crevette doté de branchies mais dépourvu d’ailes. Ils ont mesuré l’intensité d’expression des gènes candidats dans les ailes, les bourgeons d’ailes, les branchies et d’autres tissus. Dans les trois espèces, un même noyau de gènes présentait une forte activité dans les ailes ou les bourgeons d’ailes et dans les branchies, mais pas dans les tissus non apparentés. Ce motif récurrent suggère que les ailes modernes d’insectes et les branchies de crustacés s’appuient sur une boîte à outils génétique partagée qui précède l’évolution du vol.

Ce que cela implique pour l’histoire du vol

Pour le grand public, la leçon est que les ailes d’insectes pourraient ne pas être une invention entièrement nouvelle, mais une réutilisation astucieuse de branchies ancestrales guidée par un ensemble conservé de gènes. En laissant un réseau neuronal trier d’immenses quantités de données de séquences, l’étude met au jour des centaines de gènes reliant ailes et branchies à travers des branches éloignées de l’arbre des arthropodes. Si de nombreux éléments du puzzle restent à préciser, le schéma d’activité génique partagé soutient fortement l’idée que les ailes ont émergé de structures semblables à des branchies chez des ancêtres aquatiques. DeepWG offre aussi un outil général pour retracer l’évolution d’autres traits importants en lisant le langage des génomes.

Citation: Liu, F., Cao, Y., Qian, S. et al. Deep learning and attention mechanisms to identify key genes and their implications for the origin of insect wings. Sci Rep 16, 15998 (2026). https://doi.org/10.1038/s41598-026-49441-y

Mots-clés: ailes d’insectes, évolution des ailes, apprentissage profond, expression génique, branchies d’arthropodes