Clear Sky Science · it

Ottimizzazione bayesiana batch sensibile ai costi basata su processi gaussiani profondi per campagne di progettazione di materiali complessi

· Torna all'indice

Ricerche più intelligenti per materiali migliori

Progettare nuovi metalli e leghe è un po’ come cercare poche aghi preziose in un’enorme pagliaia. Ogni ricetta candidata può essere costosa da testare in laboratorio o su un supercomputer, quindi gli scienziati hanno bisogno di criteri per decidere quali poche meritano di essere esplorate. Questo articolo introduce una strategia che considera la scoperta dei materiali come un gioco ponderato di domande: decide non solo quale lega interrogare dopo, ma anche che tipo di test eseguire e quanto costerà. L’obiettivo è individuare materiali dalle prestazioni elevate più rapidamente, con meno misure e a minor costo.

Perché la ricerca è così difficile

Le leghe moderne, in particolare le leghe ad alta entropia che mescolano molti elementi in proporzioni quasi uguali, occupano spazi di progettazione enormi. Ogni composizione può avere molte proprietà importanti, come resistenza, punto di fusione e conducibilità termica, e queste spesso sono in compromesso tra loro. Misurare o simulare tutte le proprietà per ogni possibile ricetta è impossibile. I metodi tradizionali di ottimizzazione bayesiana aiutano già addestrando un “surrogato” statistico che predice le proprietà a partire da un numero limitato di esempi e suggerisce i successivi esperimenti. Ma i surrogati standard faticano quando le relazioni sono fortemente intrecciate, quando diverse proprietà sono strettamente collegate o quando per ogni campione vengono misurate solo alcune proprietà.

Modelli stratificati che apprendono strutture nascoste

Per affrontare questo, gli autori si basano sui processi gaussiani profondi, una categoria di modelli probabilistici a strati. Invece di una singola funzione liscia, sovrappongono più strati che trasformano progressivamente l’ingresso. Gli strati iniziali imparano rappresentazioni nascoste delle composizioni; gli strati successivi mappano quelle caratteristiche nascoste su più proprietà contemporaneamente. Questa gerarchia cattura in modo naturale effetti come la varia sensibilità alla composizione attraverso lo spazio di progettazione e i collegamenti complessi tra proprietà. Fondamentale è che il modello tenga traccia anche della propria incertezza, elemento vitale quando si decide se valga la pena sostenere il costo di un’altra misurazione. Poiché proprietà diverse possono essere osservate per leghe diverse, il modello beneficia comunque di dati parziali e “a macchia di leopardo” e condivide informazioni tra compiti.

Figure 1
Figure 1.

Far contare ogni misurazione

Il secondo elemento è la consapevolezza dei costi. Non tutte le misurazioni sono uguali: alcune, come test dettagliati di conducibilità termica o di punto di solidus, sono costose; altre, come densità o durezza, sono più economiche. Gli autori estendono una regola decisionale popolare che solitamente si concentra solo sul guadagno scientifico — quanto un nuovo lotto di esperimenti potrebbe migliorare i compromessi noti tra le proprietà. La loro versione divide quel guadagno per il costo totale del lotto proposto. Questo spinge l’ottimizzatore a favorire molte interrogazioni economiche e informative, riservando le misurazioni costose ai candidati più promettenti. Integrare batch “isotopici”, in cui tutte le proprietà vengono misurate insieme, con fasi “eterotopiche” che misurano selettivamente solo proprietà più economiche permette di utilizzare quei risultati per raffinare il modello prima di impegnarsi in test ad alto costo.

Test su problemi giocattolo e leghe reali

Il team ha prima confrontato diverse varianti del loro approccio su problemi di test multi‑obiettivo standard con forme e livelli di difficoltà differenti. Hanno paragonato modelli semplici a singolo compito, modelli multi‑task che condividono informazioni tra proprietà, modelli profondi puri e ibridi che combinano previsioni medie profonde con stime di incertezza multi‑task. I risultati hanno mostrato che nessun metodo vince ovunque. Modelli semplici e superficiali eccellono su paesaggi a bassa dimensionalità e curva dolce. I modelli multi‑task brillano in spazi ad alta dimensionalità dove obiettivi diversi sono strettamente collegati. Modelli profondi e ibridi mostrano i loro punti di forza su paesaggi fortemente tortuosi e non convessi, dove catturare strutture intricate e distribuzioni asimmetriche è cruciale.

Percorso più rapido verso leghe ad alte prestazioni

Per dimostrare l’impatto pratico, gli autori hanno quindi eseguito una campagna di scoperta completamente simulata per leghe refrattarie ad alta entropia destinate all’uso ad alte temperature. Hanno esplorato uno spazio di composizione a sette elementi e cercato di massimizzare contemporaneamente cinque proprietà chiave, trattando altre due proprietà come informazioni laterali utili. I costi sono stati assegnati in modo realistico — conducibilità termica e temperatura di solidus sono risultate molto più costose di densità, durezza o di un indicatore di duttilità. Il nuovo framework è stato in grado di orientare il campionamento verso regioni dello spazio di composizione che bilanciavano più obiettivi di prestazione, riutilizzando intensamente misurazioni economiche e ricorrendo con parsimonia a quelle costose. Le strategie profonde e sensibili ai costi hanno eguagliato o superato modestamente le prestazioni dei metodi tradizionali, specialmente con l’accumularsi dei dati, facendo un uso più intelligente di un budget di valutazione fissato.

Figure 2
Figure 2.

Cosa significa per la scoperta dei materiali

Per un non specialista, il messaggio principale è che questo lavoro offre un modo fondato per “spendere” lo sforzo sperimentale e computazionale in modo più saggio quando si cercano nuovi materiali. Combinando modelli probabilistici stratificati che apprendono schemi nascosti con una strategia di bilancio che confronta il guadagno scientifico atteso con il costo del test, l’approccio può raggiungere progetti di leghe ad alte prestazioni in meno passi, meglio scelti. Pur essendo i vantaggi più evidenti per problemi complessi e rumorosi, il framework pone basi importanti per future campagne in cui gli scienziati devono gestire molte variabili, numerosi obiettivi e limiti stringenti di risorse.

Citazione: Alvi, S.M.A.A., Vela, B., Attari, V. et al. Deep Gaussian process-based cost-aware batch Bayesian optimization for complex materials design campaigns. npj Comput Mater 12, 105 (2026). https://doi.org/10.1038/s41524-026-01981-7

Parole chiave: scoperta dei materiali, ottimizzazione bayesiana, processi gaussiani profondi, leghe ad alta entropia, progettazione sensibile ai costi