Clear Sky Science · it

Un approccio basato sulla teoria dell'informazione per quantificare la risposta dipendente dalla sequenza dei motori di acidi nucleici con applicazioni al sequenziamento del DNA con nanopori

· Torna all'indice

Leggere il DNA con minuscole macchine

Ogni cellula del tuo corpo si affida a macchine microscopiche che si muovono lungo il DNA, copiandolo e riparandolo. Gli stessi tipi di macchine alimentano oggi dispositivi di sequenziamento del DNA ad alta velocità. Questo studio pone una domanda apparentemente semplice ma con grandi implicazioni: oltre ai consueti segnali elettrici usati nel sequenziamento con nanopori, quanta informazione aggiuntiva sulla sequenza del DNA è nascosta nel modo in cui queste piccole macchine si muovono — quanto a lungo si fermano e quanto spesso retrocedono? Usando strumenti della teoria dell'informazione, gli autori dimostrano che questi movimenti sottili possono aumentare in modo sostanziale l'accuratezza della lettura del DNA, e delineano come progettare motori molecolari migliori per le tecnologie di sequenziamento future.

Figure 1
Figura 1.

Come i nanopori trasformano il DNA in segnali

Il sequenziamento con nanopori funziona facendo passare un singolo filamento di DNA attraverso un piccolo foro in una membrana mentre si misura il flusso di ioni attraverso il poro. Man mano che diversi gruppi di basi del DNA occupano la parte più stretta del poro, bloccano parzialmente la corrente in modi distinti, producendo un profilo elettrico caratteristico che può essere decodificato in una sequenza. Un enzima motore, qui una elicasa chiamata Hel308, afferra il DNA e lo alimenta attraverso il poro a piccoli passi. Ogni “lettura” di sequenziamento è quindi non solo una traccia di corrente ma anche un resoconto dettagliato di come l'elicasa si muove: quanto tempo attende in ogni posizione e se occasionalmente scivola indietro.

Usare la teoria dell'informazione per misurare indizi nascosti

Gli autori usano un concetto chiamato informazione mutua per quantificare quanto fortemente la sequenza del DNA controlla diversi osservabili: la corrente ionica, il tempo che Hel308 trascorre in ogni passo e la sua probabilità di retrocedere. L'informazione mutua, misurata in bit, risponde alla domanda: in media, quanto possiamo apprendere su una base del DNA da un dato segnale? Analizzando migliaia di misure, trovano che la corrente ionica è più sensibile a un tratto corto di circa quattro basi posizionate nella strozzatura del poro, mentre il moto di Hel308 è governato principalmente da basi situate a 16–21 posizioni di distanza. In particolare, basi in due posizioni (circa a 17 e 20 nucleotidi dal poro) influenzano fortemente la durata dello stazionamento dell'enzima e la probabilità di retrocedere. Combinare il tempo di stazionamento e il comportamento di retrocessione rivela più informazioni su queste basi rispetto a ciascuna caratteristica presa da sola.

Costruire mappe dal movimento alla sequenza

I dispositivi di sequenziamento spesso si basano su modelli “k-mer”, che collegano un piccolo gruppo di k basi vicine a un segnale caratteristico. Qui gli autori adattano quell'idea al moto dell'elicasa. Costruiscono modelli in cui specifiche coppie o triple di basi in posizioni chiave determinano congiuntamente il profilo dei tempi di stazionamento e delle retrocessioni. La teoria dell'informazione mostra che certe combinazioni — come le basi nelle posizioni 17 e 20, o trimetri che includono le posizioni 16, 17 e 20 — portano molta più informazione di una singola base da sola. In altre parole, l'enzima non “sente” soltanto una base alla volta; risponde a piccoli motivi di sequenza distribuiti lungo il filamento, e queste risposte possono essere mappate in modo sistematico.

Figure 2
Figura 2.

Sequenziamento simulato mostra grandi vantaggi

Per testare quanto possa essere utile nella pratica questa informazione basata sul moto, il team ha simulato corse di sequenziamento con nanopori usando modelli realistici sia della corrente sia della cinetica. Hanno poi usato un algoritmo di decodifica per ricostruire le sequenze del DNA da tre tipi di input: sola corrente, sola cinetica, o entrambe insieme. La corrente ionica da sola offre già buone prestazioni, mentre la sola cinetica è meno accurata. Ma quando entrambe vengono combinate, i tassi di errore diminuiscono drasticamente — di circa quattro-cinque volte ad alta copertura rispetto all'uso della sola corrente. Notevolmente, un numero modesto di letture che sfruttano entrambi i segnali può superare molte più letture che usano solo la corrente, suggerendo un sequenziamento più veloce e accurato se i dati cinetici vengono pienamente sfruttati.

Regolare lo stesso motore molecolare

I ricercatori esplorano anche come modificare l'elicasa potrebbe aumentare ulteriormente le prestazioni. Guidati da dati strutturali, hanno mutato singoli amminoacidi in Hel308 che entrano in contatto con il DNA e hanno esaminato come questi cambiamenti influenzassero i tempi di stazionamento e le retrocessioni. La maggior parte delle mutazioni aveva poco effetto, ma alcune hanno provocato spostamenti ampi e sistematici nella durata delle pause e nella frequenza delle retrocessioni, pur preservando la sensibilità alla sequenza. Due posizioni nella proteina, in particolare, rispecchiavano le posizioni chiave della sequenza messe in evidenza dall'analisi informativa, suggerendo un collegamento diretto tra specifici amminoacidi e il comportamento di riconoscimento della sequenza dell'enzima. Lo studio mostra anche che esiste un compromesso: un mutante che trasmette leggermente più informazione per passo si muove più lentamente, perciò la sua informazione totale al secondo è simile a quella dell'enzima originale.

Perché questo è importante per la lettura del DNA futura

Per un non specialista, il risultato principale è che i sequenziatori a nanopori possono fare più che leggere schemi elettrici dal DNA; possono anche ascoltare come si comporta il motore molecolare mentre cammina lungo il filamento. Questo lavoro fornisce un metodo rigoroso per misurare quanta informazione di sequenza aggiuntiva è contenuta in quel movimento e mostra che includerla potrebbe migliorare notevolmente l'accuratezza, specialmente in regioni difficili come le ripetizioni o in alfabeti genetici espansi. Usando la teoria dell'informazione come strumento di progettazione e screening, gli scienziati possono ingegnerizzare in modo sistematico enzimi motori le cui pause e titubanze rendono le sequenze di DNA più facili da leggere, aprendo la strada a tecnologie di sequenziamento più veloci, affidabili e versatili.

Citazione: Craig, J.M., Laszlo, A.H., Brinkerhoff, H. et al. An information theory approach to quantifying the sequence-dependent response of nucleic acid motors with applications to nanopore DNA sequencing. Nat Commun 17, 3231 (2026). https://doi.org/10.1038/s41467-026-69867-2

Parole chiave: sequenziamento con nanopori, cinetica dell'elicasa, teoria dell'informazione, enzimi motori del DNA, modelli k-mer