Clear Sky Science · nl

Deep Gaussian process-gebaseerde kostenbewuste batch-Bayesiaanse optimalisatie voor complexe materiaalontwerpcampagnes

· Terug naar het overzicht

Slimmere zoektochten naar betere materialen

Het ontwerpen van nieuwe metalen en legeringen is een beetje alsof je naar een paar kostbare naalden zoekt in een berg hooiberg. Elk kandidaatrecept kan duur zijn om in het lab of op een supercomputer te testen, dus onderzoekers hebben manieren nodig om te beslissen welke weinigen het waard zijn om als volgende te onderzoeken. Dit artikel introduceert een strategie die materiaalontdekking behandelt als een zorgvuldig vragenspel: het besluit niet alleen welke legering het volgende onderwerp van onderzoek is, maar ook welk type test wordt uitgevoerd en hoeveel die test zal kosten. Het doel is om sneller tot hoogpresterende materialen te komen, met minder en goedkoper meetwerk.

Waarom de zoektocht zo moeilijk is

Moderne legeringen, vooral high‑entropy legeringen die veel elementen in ongeveer gelijke hoeveelheden mengen, bevinden zich in uitgestrekte ontwerpruimtes. Elke samenstelling kan veel belangrijke eigenschappen hebben, zoals sterkte, smeltpunt en thermische geleidbaarheid, en die staan vaak in wisselwerking met elkaar. Alles voor elk mogelijk recept meten of simuleren is onmogelijk. Traditionele Bayesiaanse optimalisatiemethoden helpen al door een statistische “surrogaat” te trainen die eigenschappen voorspelt op basis van een beperkt aantal voorbeelden en de volgende experimenten suggereert. Maar standaard surrogaten hebben moeite wanneer relaties sterk verstrengeld zijn, wanneer verschillende eigenschappen sterk gekoppeld zijn, of wanneer voor elk monster slechts sommige eigenschappen worden gemeten.

Gelaagde modellen die verborgen structuur leren

Om dit aan te pakken bouwen de auteurs voort op deep Gaussian processes, een soort gelaagd probabilistisch model. In plaats van één enkele vloeiende functie stapelen zij meerdere lagen die de invoer geleidelijk transformeren. Vroege lagen leren verborgen representaties van legeringssamenstellingen; latere lagen koppelen die verborgen kenmerken aan meerdere eigenschappen tegelijk. Deze hiërarchie legt op natuurlijke wijze effecten vast zoals variërende gevoeligheid voor samenstelling over de ontwerpruimte en complexe verbanden tussen eigenschappen. Cruciaal is dat het model ook zijn eigen onzekerheid bijhoudt, wat essentieel is bij het beslissen of het de moeite waard is om te betalen voor een extra meting. Omdat verschillende eigenschappen voor verschillende legeringen kunnen worden waargenomen, kan het model nog steeds profiteren van gedeeltelijke, “lapjesachtige” data en informatie tussen taken delen.

Figure 1
Figure 1.

Elke meting goed benutten

Het tweede ingrediënt is kostenbewustzijn. Niet alle metingen zijn gelijk: sommige, zoals gedetailleerde thermische geleidbaarheids- of smeltpunttests, zijn duur; andere, zoals dichtheid of hardheid, zijn goedkoper. De auteurs breiden een populaire beslisregel uit die zich normaal gesproken alleen richt op wetenschappelijke winst — hoeveel een nieuwe batch experimenten de beste bekende afwegingen tussen eigenschappen zou kunnen verbeteren. Hun versie deelt die winst door de totale kosten van de voorgestelde batch. Dit zet de optimizer ertoe aan veel goedkope, informatieve vragen te prefereren en dure metingen te reserveren voor de meest veelbelovende kandidaten. Ze combineren ook “isotopische” batches, waarbij alle eigenschappen samen worden gemeten, met “heterotopische” stappen die selectief alleen goedkopere eigenschappen meten, en gebruiken die resultaten om het model aan te scherpen voordat ze zich vastleggen op dure tests.

Testen op toy-problemen en echte legeringen

Het team evalueerde eerst meerdere varianten van hun aanpak op standaard multi‑objective testproblemen met verschillende vormen en moeilijkheidsgraden. Ze vergeleken simpele single‑task modellen, multi‑task modellen die informatie over eigenschappen delen, pure diepe modellen en hybriden die diepe gemiddelde voorspellingen combineren met multi‑task onzekerheidsschattingen. De resultaten toonden aan dat geen enkele methode overal wint. Eenvoudige, ondiepe modellen excelleren op laagdimensionale, zacht gekromde landschappen. Multi‑task modellen blinken uit in hoogdimensionale ruimtes waar verschillende doelstellingen sterk gekoppeld zijn. Diepe en hybride modellen tonen hun kracht op sterk verwrongen, niet‑convexe landschappen, waar het vastleggen van ingewikkelde structuur en scheve verdelingen het meest telt.

Snellere weg naar hoogpresterende legeringen

Om praktische impact te tonen, voerden de auteurs vervolgens een volledig gesimuleerde ontdekkingscampagne uit voor refractaire high‑entropy legeringen bedoeld voor gebruik bij hoge temperaturen. Ze verkenden een combinatiegebied met zeven elementen en probeerden vijf belangrijke eigenschappen tegelijk te maximaliseren, terwijl twee aanvullende eigenschappen als nuttige aanvullende informatie werden behandeld. Kosten werden realistisch toegewezen — thermische geleidbaarheid en solidustemperatuur waren veel duurder dan dichtheid, hardheid of een taaiheidsindicator. Het nieuwe kader kon de sampling sturen naar regio’s in de samenstellingsruimte die meerdere prestatiedoelen in balans brachten, terwijl het veelvuldig goedkope metingen hergebruikte en zuinig was met kostbare metingen. Diepe, kostenbewuste strategieën haalden het niveau van traditionele methoden of overtroffen deze licht, vooral naarmate meer data zich ophoopten, en deden dit met slimmer gebruik van een vast evaluatiebudget.

Figure 2
Figure 2.

Wat dit betekent voor materiaalontdekking

Voor niet‑specialisten is de kernboodschap dat dit werk een beargumenteerde manier biedt om experimentele en computationele inspanning wijzer te “verspillen” bij het zoeken naar nieuwe materialen. Door gelaagde probabilistische modellen die verborgen patronen leren te combineren met een budgetteringsstrategie die de verwachte wetenschappelijke winst afweegt tegen de testkosten, kan de aanpak hoogpresterende legeringsontwerpen in minder, beter gekozen stappen bereiken. Hoewel de voordelen het meest uitgesproken zijn bij complexe, rumoerige problemen, legt het kader belangrijk fundament voor toekomstige campagnes waarin wetenschappers veel variabelen, veel doelstellingen en strakke middelen moeten balanceren.

Bronvermelding: Alvi, S.M.A.A., Vela, B., Attari, V. et al. Deep Gaussian process-based cost-aware batch Bayesian optimization for complex materials design campaigns. npj Comput Mater 12, 105 (2026). https://doi.org/10.1038/s41524-026-01981-7

Trefwoorden: materiaalontdekking, Bayesiaanse optimalisatie, deep Gaussian processes, high-entropy legeringen, kostenbewust ontwerp