Clear Sky Science · it
NuConf: una libreria di rotameri per DNA e RNA e la sua implementazione nel software di progettazione proteica MUMBO
Perché rimodellare DNA e RNA al computer conta
La progettazione di nuove proteine con strumenti computazionali ha fatto grandi passi avanti negli ultimi anni, ma DNA e RNA sono rimasti in gran parte indietro. Le strutture di queste molecole genetiche sono meno documentate, il che rende difficile per l’intelligenza artificiale apprendere come si piegano, si torcono e interagiscono con le proteine. Questo studio presenta NuConf, un nuovo modo di rappresentare le forme dei mattoni di DNA e RNA in modo che il software di progettazione proteica esistente possa progettare anche gli acidi nucleici e le loro superfici di contatto con le proteine. 
Come i progettisti gestiscono solitamente le parti laterali flessibili
Quando gli scienziati progettano proteine al computer, non esplorano ogni possibile movimento di ogni atomo delle catene laterali. Invece, usano “librerie di rotameri”, collezioni di forme comuni delle catene laterali derivate da migliaia di strutture conosciute. Programmi come MUMBO applicano queste forme a un impalcato proteico fisso e usano calcoli energetici per decidere quale combinazione si adatta meglio. Finora mancava una libreria pratica e comparabile per le parti laterali delle basi di DNA e RNA, in particolare una che permettesse allo stesso programma di trattare proteine, DNA e RNA sullo stesso piano.
Mappare le forme preferite di DNA e RNA
Gli autori hanno iniziato esaminando più di 175.000 nucleotidi provenienti da strutture cristallografiche di alta qualità di DNA, RNA e dei loro complessi con proteine. Per ogni nucleotide hanno misurato due angoli chiave: uno che cattura come il ciclo di zucchero dell’impalcato è deformato, e uno che descrive come la base attaccata è ruotata rispetto a quello zucchero. Hanno scoperto che gli zuccheri favoriscono due ampie famiglie di forme, una più tipica del DNA e una dell’RNA, e che queste forme dello zucchero sono fortemente legate all’orientamento della base. In altre parole, la postura dell’impalcato e la direzione della base non sono indipendenti; si muovono insieme in modi caratteristici.
Trasformare i modelli strutturali in una libreria pratica
Per trasformare questi modelli in qualcosa che un programma di progettazione possa usare, il team ha applicato modelli statistici che scompongono distribuzioni angolari complesse in un piccolo insieme di picchi distinti, ciascuno rappresentante un orientamento della base frequentemente usato. Per ogni tipo di base in DNA e RNA, e per ogni ampia forma di zucchero, hanno definito da tre a sei orientamenti preferiti, insieme alla frequenza con cui ciascuno si verifica. Questa collezione, chiamata NuConf, funge da “catalogo di forme” dei nucleosidi legato alla postura locale dell’impalcato. Hanno inoltre creato una versione di riserva più semplice con meno forme, che sacrifica parte del dettaglio per ridurre i costi computazionali. 
Testare se le nuove forme funzionano davvero
I ricercatori hanno poi integrato queste forme in MUMBO e si sono posti due domande: il programma, dato un impalcato fisso, poteva ricostruire le posizioni delle basi osservate nelle strutture reali, e poteva scegliere buone forme e sequenze usando solo punteggi energetici, senza conoscere la risposta? In ampi set di test contenenti decine di migliaia di nucleotidi, la libreria NuConf ha riprodotto le posizioni delle basi con una precisione paragonabile e talvolta migliore rispetto alle librerie standard usate per le catene laterali proteiche. Quando il programma ha dovuto scegliere le forme basandosi unicamente sull’energia, NuConf ha comunque superato una libreria più semplice e strumenti concorrenti per acidi nucleici, catturando al contempo i contatti chiave di appaiamento e impilamento delle basi sia negli acidi nucleici liberi sia nei complessi proteina–acido nucleico.
Cosa significa per la progettazione molecolare futura
Per i non specialisti, la conclusione principale è che gli autori hanno fornito alla progettazione assistita dal computer un nuovo linguaggio condiviso per proteine e acidi nucleici. NuConf permette al software di progettazione proteica esistente di posizionare e selezionare in modo affidabile basi di DNA e RNA lungo un impalcato dato e nei siti di contatto con proteine. Questo non sostituisce i moderni metodi di AI, ma colma una lacuna importante quando i dati di addestramento scarseggiano o quando devono essere valutate interazioni fisiche dettagliate. A lungo termine, questo tipo di strumento potrebbe aiutare i ricercatori a progettare regolatori genici più precisi, interruttori di RNA e macchine ibride proteina–acido nucleico interamente in silico prima di realizzarli in laboratorio.
Citazione: Makarova, M.O., Stiebritz, M.T., Basturk, D. et al. NuConf: a rotamer library for DNA and RNA and its implementation in the protein design software MUMBO. Sci Rep 16, 16281 (2026). https://doi.org/10.1038/s41598-026-52380-3
Parole chiave: progettazione di acidi nucleici, libreria di rotameri, interazioni proteina–DNA, modellazione dell'RNA, biologia strutturale computazionale