Clear Sky Science · it

DeepRetro scopre percorsi retrosintetici tramite ragionamento iterativo di grandi modelli linguistici

2026-02-12 · Torna all'indice

Perché una chimica più intelligente conta

Molti dei farmaci e dei materiali più importanti di oggi nascono da molecole complesse e difficili da ottenere. Pianificare come costruire queste molecole in laboratorio è un po’ come capire il modo migliore per smontare e poi ricostruire un macchinario elaborato a partire dai pezzi di ricambio. Quel passo di progettazione, chiamato disegno della sintesi, è spesso un significativo collo di bottiglia per la scoperta di farmaci e per i materiali avanzati. Questo articolo presenta DeepRetro, un nuovo sistema open source che utilizza grandi modelli linguistici — la stessa classe di IA dietro ai moderni chatbot — insieme a software chimici tradizionali e competenza umana per progettare ricette realistiche, passo dopo passo, per ottenere molecole molto complesse.

Spezzare le grandi molecole in pezzi gestibili

I chimici di norma progettano una sintesi lavorando all’indietro a partire dalla molecola target, “sgranandola” mentalmente in pezzi più semplici che possono essere acquistati o sintetizzati. I computer aiutano in questo compito da decenni, ma gli strumenti esistenti faticano quando le molecole diventano troppo intrecciate, esotiche o diverse da quanto presente nei loro database di reazioni. DeepRetro affronta questo problema combinando due mondi: motori veloci basati su regole che applicano schemi di reazione noti, e un “cervello” basato su modelli linguistici che può suggerire modi inusuali ma chimicamente sensati per spezzare una molecola. Invece di chiedere all’IA di inventare una ricetta completa in una sola volta, DeepRetro le richiede un solo passo all’indietro per volta e verifica attentamente ogni suggerimento.

Mantenere l’IA onesta

Un problema chiave con i grandi modelli linguistici è che possono “allucinare”: possono proporre con sicurezza passaggi che violano la chimica di base. DeepRetro avvolge l’IA in diversi strati di controlli automatici. Ogni molecola intermedia proposta viene testata per correttezza semplice (per esempio, se gli atomi hanno il giusto numero di legami), per probabile stabilità e per coerenza interna con il resto della reazione. I suggerimenti che falliscono questi test vengono scartati. Per quelli che li superano, il sistema chiama poi un motore di ricerca più tradizionale per verificare se la chimica nota può collegare questi mattoni di partenza a materiali iniziali reali e acquistabili. I chimici possono inoltre intervenire in qualsiasi momento tramite un’interfaccia grafica: possono modificare strutture, rieseguire solo una porzione di un percorso o aggiungere gruppi protettivi comuni che rendono praticabile la chimica multi-step.

Mettere il sistema alla prova

Per valutare l’efficacia di DeepRetro, gli autori lo hanno testato su collezioni di riferimento standard di reazioni tratte da banche dati di brevetti. Per previsioni a singolo passo — indovinare quali reagenti potrebbero formare un dato prodotto — il sistema ha eguagliato o superato strumenti esistenti di buona qualità su diverse misure, soprattutto nell’identificare correttamente il precursore principale anche quando gli ingredienti minori differivano. Per la pianificazione multi-step, DeepRetro ha risolto quasi tutti gli obiettivi in due set di test impegnativi, inclusa una raccolta di molecole simili a farmaci particolarmente insidiose, superando i metodi precedenti allo stato dell’arte. È importante notare che questi test sono stati eseguiti in modalità completamente automatica, senza correzioni umane, dimostrando che il quadro è robusto anche prima dell’intervento di chimici esperti.

Casi reali

I benchmark da soli possono non cogliere ciò che interessa davvero ai chimici: una via proposta sembra qualcosa che un praticante esperto potrebbe effettivamente provare in laboratorio? Gli autori hanno quindi studiato cinque famosi prodotti naturali altamente complessi, tra cui gli antibiotici eritromicina B e discodermolide, e l’alcaloide reserpina. Per ciascun caso, DeepRetro ha lavorato insieme a chimici umani in un ciclo iterativo. L’IA ha suggerito disconnessioni e frammenti di percorso; i chimici hanno potatuo idee dubbie, corretto sottili problemi stereochimici e talvolta hanno guidato il sistema con un intermedio chiave. In due casi, DeepRetro ha prodotto piani sintetici completi la cui strategia complessiva non corrispondeva a nulla che gli autori avessero trovato in letteratura, sebbene le singole reazioni fossero note. Questo suggerisce che il sistema può ricombinare chimica familiare in rotte globali veramente nuove.

Promesse, limiti e prossimi passi

DeepRetro dimostra che i grandi modelli linguistici possono essere più di abili generatori di testo; quando strettamente supervisionati e combinati con strumenti consolidati, possono aiutare a navigare l’enorme spazio di ricerca delle possibili sintesi chimiche. Il quadro ha ancora limiti: i modelli linguistici generalisti spesso propongono intermedi instabili o irrealistici, e soluzioni completamente automatiche per le molecole più difficili restano fuori portata senza supervisione umana. Tuttavia, le prestazioni solide di DeepRetro sui test standard, il suo successo in casi studio impegnativi e il rilascio open source ne fanno un modello pratico per la futura scoperta scientifica assistita dall’IA. Per i non specialisti, la conclusione è che l’IA sta passando dal prevedere semplicemente proprietà molecolari al co-progettare intere ricette di laboratorio, con il potenziale di accelerare la creazione di farmaci e materiali negli anni a venire.

Citazione: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

Parole chiave: retrosintesi, grandi modelli linguistici, pianificazione della sintesi organica, scoperta di farmaci, chimica computazionale