Clear Sky Science · it

Migliorare la predizione delle proprietà dei materiali basata sulla composizione mediante trasferimento di conoscenza cross-modale

· Torna all'indice

Perché è importante prevedere il comportamento dei materiali

Progettare nuove batterie, celle solari o leghe più resistenti spesso parte da una semplice ricetta che elenca quali elementi mescolare. Trasformare quella ricetta in un materiale reale con resistenza, conducibilità o stabilità note richiede solitamente costosi calcoli quantistici o esperimenti. Questo studio mostra come modelli avanzati basati sul linguaggio, originariamente concepiti per leggere testi, possano apprendere da molti tipi di dati sui materiali e poi prevedere proprietà importanti direttamente da una formula chimica, riducendo costi e tempi necessari per esplorare ampi spazi di composti possibili.

Figure 1. Come l’IA collega le «ricette» chimiche al comportamento dei materiali usando conoscenze condivise da molteplici tipi di dati.
Figure 1. Come l’IA collega le «ricette» chimiche al comportamento dei materiali usando conoscenze condivise da molteplici tipi di dati.

Dalle ricette alle previsioni

Gli strumenti tradizionali di machine learning nella scienza dei materiali si dividono in due categorie. Una famiglia richiede strutture cristalline dettagliate, che descrivono come gli atomi sono disposti in tre dimensioni, e può quindi prevedere le proprietà con accuratezza ma a elevato costo computazionale. L’altra famiglia considera solo la formula chimica complessiva, ad esempio il numero di atomi di ciascun elemento, che è più economica ma di solito meno precisa. Gli autori mirano a colmare questo divario: vogliono modelli che vedano solo la formula ma che si comportino quasi quanto i metodi che tengono conto della struttura, permettendo screening rapidi di composti mai sintetizzati o neppure modellati strutturalmente.

Insegnare all’IA il linguaggio dei materiali

Il gruppo si basa sui modelli linguistici chimici, che trattano una formula come una stringa di token, molto simile a parole in una frase. In primo luogo, questi modelli imparano a riempire parti mancanti delle formule, un compito di addestramento che li aiuta a catturare regolarità su quali elementi si combinano e in quali rapporti. Gli autori indirizzano poi questo apprendimento verso materiali termodinamicamente stabili, così il modello dà più peso a composizioni realistiche. Introducono quindi una svolta cruciale: invece di apprendere solo dal testo come i modelli linguistici tradizionali, i loro modelli sono allineati con un modello fondamentale separato che ha già appreso da più fonti, incluse strutture cristalline, comportamento elettronico e distribuzioni di carica. In pratica, il modello linguistico eredita ricche conoscenze strutturali pur continuando a lavorare solo con le formule.

Figure 2. Come un modello basato sulla formula assorbe schemi strutturali ed elettronici per prevedere le proprietà dei materiali.
Figure 2. Come un modello basato sulla formula assorbe schemi strutturali ed elettronici per prevedere le proprietà dei materiali.

Due vie per condividere la conoscenza

I ricercatori esplorano due strategie complementari, che chiamano trasferimento implicito ed esplicito di conoscenza cross-modale. Nella versione implicita, il modello linguistico basato sulla formula viene addestrato a corrispondere alle rappresentazioni interne prodotte dal modello fondamentale multimodale, in modo da assorbire silenziosamente come strutture e schemi elettronici si relazionano alla composizione. Nella versione esplicita, un grande modello generativo propone prima probabili strutture cristalline per ogni formula, e poi reti neurali a grafi, efficaci nel trattare reti di atomi, prevedono le proprietà a partire da quelle strutture. Questa via in due passi tenta di ricostruire l’informazione cristallina mancante prima di effettuare la predizione.

Quanto funzionano i metodi

I modelli sono testati su due grandi suite di benchmark che coprono decine di grandezze target, dai gap di banda rilevanti per le celle solari a proprietà meccaniche come il modulo di taglio. Nella maggior parte di questi compiti, specialmente per i dataset basati su calcoli meccanici quantistici, i modelli con trasferimento implicito forniscono errori di predizione minori rispetto ai precedenti modelli linguistici e spesso rivaleggiano con forti concorrenti basati sulla struttura. La pipeline di trasferimento esplicito migliora anch’essa rispetto ai modelli linguistici basati sulla composizione precedenti, ma è rallentata dalla necessità di generare strutture cristalline. Produrre queste strutture può richiedere tempi decine di volte maggiori per materiale rispetto a una predizione diretta del modello linguistico, in particolare quando le composizioni coinvolgono molti elementi diversi.

Uno sguardo dentro la scatola nera

Per capire cosa ha appreso il modello linguistico, gli autori applicano un’analisi ispirata alla teoria dei giochi che misura come diverse parti dell’input, da sole o in combinazione, influenzano la proprietà predetta. Osservando il modulo di taglio, che riguarda la resistenza di un materiale al cambiamento di forma, trovano che certi elementi e raggruppamenti di elementi aumentano o diminuiscono fortemente il valore, in accordo con composti duri noti come boruri e carburi. Alcuni pattern di tre token nella formula possono perfino essere collegati a prototipi cristallini familiari, suggerendo che il modello ha implicitamente acquisito motivi strutturali a partire solo dalla composizione.

Cosa significa per la scoperta futura dei materiali

Nel complesso, lo studio mostra che condividere conoscenza tra diversi tipi di dati sui materiali può migliorare significativamente la predizione delle proprietà quando è disponibile solo la formula chimica. L’approccio implicito, in cui il modello linguistico è guidato da un modello fondamentale multimodale, offre il miglior compromesso tra accuratezza e velocità, risultando attraente per ampi screening virtuali di nuovi composti. La via esplicita che ricostruisce le strutture cristalline propone un altro angolo promettente, soprattutto man mano che i generatori di strutture migliorano. Insieme, questi metodi puntano verso strumenti di IA in grado di scandagliare rapidamente vasti spazi chimici e mettere in evidenza i candidati più promettenti molto prima che venga coltivato un singolo cristallo.

Citazione: Rubtsov, I., Dudakov, I., Kuratov, Y. et al. Enhancing composition-based materials property prediction by cross-modal knowledge transfer. Sci Rep 16, 16434 (2026). https://doi.org/10.1038/s41598-026-53182-3

Parole chiave: informatica dei materiali, modelli linguistici chimici, predizione delle proprietà, apprendimento multimodale, strutture cristalline