Clear Sky Science · it

Apprendimento profondo e meccanismi di attenzione per identificare geni chiave e le loro implicazioni sull’origine delle ali degli insetti

· Torna all'indice

Perché le ali degli insetti ci interessano

Gli insetti dominano il pianeta per numero e varietà, e le loro ali sono una grande ragione di questo successo. Le ali permettono agli insetti di disperdersi, trovare cibo, sfuggire ai predatori e modellare interi ecosistemi. Eppure gli scienziati discutono ancora su come queste strutture delicate siano nate da antenati privi di ali. Questo studio utilizza l’intelligenza artificiale moderna per cercare indizi nel DNA degli insetti, rivelando un programma genetico condiviso tra ali e branchie che getta nuova luce sull’origine delle ali.

Guardando indietro ai mari antichi

Per capire le ali degli insetti, gli autori partono da un’idea semplice: gli insetti odierni si sono probabilmente evoluti da animali simili a crostacei che vivevano in acqua e respiravano con branchie. Idee concorrenti suggeriscono che le ali possano essersi sviluppate da organi respiratori simili a branchie, da piastre piatte sul corpo, o da lobi laterali del torace, e alcune ricerche indicano una combinazione di queste fonti. Se le ali derivano davvero dalle branchie, allora i geni chiave dovrebbero mostrare un’attività simile nelle ali degli insetti e nelle branchie delle specie acquatiche affini. Piuttosto che testare solo pochi geni alla volta, il team ha deciso di scandagliare l’insieme completo delle proteine di molte specie per trovare schemi nascosti legati alle ali.

Figure 1. Dalle antiche branchie alle ali volanti: l’IA traccia il progetto genetico condiviso tra le specie.
Figure 1. Dalle antiche branchie alle ali volanti: l’IA traccia il progetto genetico condiviso tra le specie.

Insegnare a una rete neurale a leggere i geni

I ricercatori hanno costruito un sistema di apprendimento profondo chiamato DeepWG per distinguere le proteine di specie dotate di ali da quelle di specie senza ali. Hanno raccolto proteomi di 119 specie, inclusi insetti e loro parenti stretti, e hanno mantenuto solo dati di alta qualità. Ogni sequenza proteica è stata suddivisa in brevi blocchi di tre lettere, come se si spezzassero frasi in frammenti di parole. Questi frammenti sono stati convertiti in vettori numerici usando tecniche derivate dall’elaborazione del linguaggio, quindi immessi in una rete a memoria bidirezionale con uno strato di attenzione aggiunto. Questa configurazione permette al modello di scansionare le sequenze proteiche in entrambe le direzioni e concentrarsi sulle regioni più informative senza regole manuali.

Trovare i geni da cui dipendono le ali

DeepWG si è dimostrato altamente accurato, classificando correttamente i campioni di test oltre il 97% delle volte e superando reti neurali più semplici. Lo strato di attenzione assegna un peso a ogni famiglia di geni correlati, evidenziando quali sono più importanti per distinguere specie con ali da quelle senza. Da quasi 28.000 famiglie geniche, il 5% con i pesi più alti ha prodotto 3.872 geni candidati, inclusi molti già noti per plasmare le ali degli insetti. Esempi famosi includono geni che controllano la crescita, il patterning e la dimensione delle ali, così come vie che regolano la divisione cellulare e la risposta ai segnali. L’analisi di rete dell’attività genica ha raggruppato molti di questi geni in moduli strettamente legati allo sviluppo delle ali nella Drosophila, aumentando la fiducia che DeepWG stia individuando attori significativi anziché rumore casuale.

Figure 2. Come una rete neurale filtra sequenze geniche per separare passo dopo passo i geni legati alle ali dagli altri geni.
Figure 2. Come una rete neurale filtra sequenze geniche per separare passo dopo passo i geni legati alle ali dagli altri geni.

Ali e branchie che cantano la stessa canzone

La prova più evidente è venuta confrontando il comportamento di questi geni chiave tra specie e tessuti. Il team ha esaminato la Drosophila, una efemera con sia abbozzi alari sia branchie acquatiche, e un crostaceo simile a un gambero con branchie ma senza ali. Hanno verificato quanto fortemente i geni candidati fossero attivati in ali, abbozzi alari, branchie e altri tessuti. In tutte e tre le specie, lo stesso insieme centrale di geni mostrava alta attività nelle ali o negli abbozzi alari e nelle branchie, ma non in tessuti non correlati. Questo schema ripetuto suggerisce che le ali degli insetti moderni e le branchie dei crostacei attingono a un toolkit genetico condiviso che precede l’evoluzione del volo.

Cosa significa per la storia del volo

Per i non specialisti, il messaggio principale è che le ali degli insetti potrebbero non essere un’invenzione totalmente nuova, ma una rielaborazione intelligente di branchie ancestrali guidata da un insieme di geni conservati. Permettendo a una rete neurale di setacciare enormi quantità di dati di sequenze, lo studio scopre centinaia di geni che collegano ali e branchie attraverso rami distanti dell’albero filogenetico degli artropodi. Pur rimanendo molte tessere del puzzle da ricomporre, il pattern di attività genica condiviso sostiene con forza l’idea che le ali siano emerse da strutture simili a branchie in antichi antenati acquatici. DeepWG offre inoltre uno strumento generale per tracciare come si sono evoluti altri tratti importanti leggendo il linguaggio dei genomi.

Citazione: Liu, F., Cao, Y., Qian, S. et al. Deep learning and attention mechanisms to identify key genes and their implications for the origin of insect wings. Sci Rep 16, 15998 (2026). https://doi.org/10.1038/s41598-026-49441-y

Parole chiave: ali degli insetti, evoluzione delle ali, apprendimento profondo, espressione genica, branchie degli artropodi