Clear Sky Science · it
Ottimizzare il trasferimento cross-dominio per potenziali interatomici universali basati su machine learning
Simulazioni più intelligenti per materiali reali
La progettazione di nuove batterie, catalizzatori e materiali elettronici si basa sempre più su simulazioni al computer che seguono gli atomi in movimento. Le simulazioni più affidabili, basate sulla meccanica quantistica, sono estremamente accurate ma troppo lente per esplorare milioni di materiali candidati. Modelli più rapidi basati su machine learning possono emulare i calcoli quantistici, ma spesso funzionano solo in contesti ristretti — per esempio solo cristalli o solo molecole. Questo articolo propone un modo per costruire un unico modello universale, chiamato SevenNet-Omni, che mantiene l’accuratezza attraverso molti tipi di materiali, da superfici metalliche e liquidi molecolari a strutture porose, restando però abbastanza veloce da consentire la scoperta su larga scala.

Perché i modelli atomici attuali non viaggiano bene
I potenziali interatomici basati su machine learning attuali sono di solito addestrati su un singolo database accuratamente curato: uno per cristalli inorganici, un altro per molecole di tipo farmaceutico, un altro ancora per superfici catalitiche. Ogni database è costruito con impostazioni quantistiche proprie, quindi i paesaggi energetici sottostanti differiscono in modi sottili e non lineari. Limitarsi ad unire questi dati — magari spostando o scalando le energie — introduce rumore e porta a modelli che si adattano bene al proprio dominio ma falliscono nel descrivere chimiche sconosciute o metodi quantistici leggermente diversi. Poiché i problemi dei materiali mescolano sempre più domini, come molecole che reagiscono su superfici solide in soluzione, questa scarsa trasferibilità è diventata un serio collo di bottiglia.
Una spina dorsale condivisa con una leggera specializzazione
Gli autori affrontano il problema trattando ogni database come un proprio “compito” all’interno di una singola rete neurale multi-task. All’interno del modello, un insieme di parametri forma una spina dorsale condivisa, che cattura regole generali del legame atomico, mentre parametri più piccoli e specifici per compito affinano il comportamento per dataset particolari. Un’analisi matematica mostra che, se le parti specifiche per compito crescono troppo, il modello memorizza efficacemente ogni database e dimentica come generalizzare. Per evitarlo, gli autori applicano una regolarizzazione selettiva: penalizzano direttamente i parametri specifici per compito di grande entità ma lasciano libera di crescere la spina dorsale condivisa quando necessario. Ciò spinge la rete a spiegare il più possibile tramite fisica comune, usando correzioni modeste per ciascun dominio.

Colmare mondi distanti con pochi esempi chiave
Anche con la regolarizzazione, alcune regioni dello spazio chimico compaiono solo in un database, quindi la spina dorsale condivisa non riceve indicazioni in quei punti. Per risolvere questo problema, il team introduce un “insieme di collegamento tra domini”. Selezionano con cura una minuscola frazione — circa una su mille — di configurazioni da diversi database e le ricalcolano usando un’unica impostazione quantistica comune. Queste strutture di collegamento agiscono come frasi bilingue in un libro di lingua: collegano direttamente il modo in cui due diversi metodi quantistici descrivono la stessa scena atomica. Quando incluse nell’addestramento, rafforzano fortemente il legame tra i compiti, allineando i paesaggi energetici senza la necessità di ricalcolare tutto con forza bruta. Test sistematici mostrano che regolarizzazione e insieme di collegamento si rinforzano a vicenda, migliorando le prestazioni oltre ciò che ciascuna può ottenere da sola.
Costruire e testare un motore atomico universale
Sulla base di queste idee, gli autori addestrano SevenNet-Omni su 15 dataset pubblici che comprendono circa 242 milioni di strutture atomiche, coprendo molecole, cristalli, catalizzatori, strutture metal-organiche e più livelli di teoria quantistica. Poi valutano il modello in situazioni familiari e sfidanti: stabilità dei cristalli, bordi di grano nei metalli, difetti negli acciai, barriere di torsione in molecole di tipo farmaceutico, perovskiti ibride organico-inorganiche, adsorbimento in strutture porose rilevanti per la cattura del carbonio e reazioni su superfici metalliche importanti per la conversione di idrogeno e anidride carbonica. In questi test, SevenNet-Omni spesso eguaglia o supera modelli specializzati addestrati per un singolo dominio, e mantiene l’"accuratezza chimica" per molte energie di reazione e adsorbimento. Riproduce inoltre con precisione i risultati di un metodo quantistico costoso (r²SCAN) imparando come quel metodo si relaziona a dati più economici e più abbondanti.
Cosa significa per la scoperta di nuovi materiali
Per i non esperti, il messaggio chiave è che SevenNet-Omni si comporta molto come uno scienziato esperto che ha lavorato in molti sotto-campi. Invece di sovradattarsi a un problema stretto, impara principi chimici ampi e li applica con flessibilità a nuove situazioni, dalla cattura di gas in solidi porosi alle reazioni su elettrodi metallici. L’articolo mostra che ciò è possibile condividendo con cura l’informazione tra i dataset pur limitandone leggermente le differenze, e aggiungendo un piccolo numero di esempi di “traduzione” selezionati tra metodi quantistici. Con l’emergere di database sempre più grandi e diversificati, questa strategia di addestramento offre una strada scalabile verso modelli atomici veramente universali e affidabili, in grado di accelerare la scoperta in chimica, fisica e scienza dei materiali.
Citazione: Kim, J., You, J., Park, Y. et al. Optimizing cross-domain transfer for universal machine learning interatomic potentials. Nat Commun 17, 3432 (2026). https://doi.org/10.1038/s41467-026-70195-8
Parole chiave: potenziali interatomici basati su machine learning, modellizzazione dei materiali multi-dominio, transfer learning, potenziale atomistico universale, scoperta dei materiali