Clear Sky Science · nl

Optimalisatie van domeinoverstap voor universele machine-learning interatomaire potentialen

· Terug naar het overzicht

Slimmere simulaties voor echte materialen

Het ontwerpen van nieuwe batterijen, katalysatoren en elektronische materialen hangt steeds vaker af van computersimulaties die atomen in beweging volgen. De meest betrouwbare simulaties, gebaseerd op kwantummechanica, zijn extreem nauwkeurig maar veel te traag om miljoenen kandidaatmaterialen te onderzoeken. Snellere machine-learningmodellen kunnen kwantumberekeningen nabootsen, maar werken vaak alleen in smalle situaties — bijvoorbeeld alleen kristallen of alleen moleculen. Dit artikel stelt een manier voor om één universeel model te bouwen, genaamd SevenNet-Omni, dat nauwkeurig blijft over veel soorten materialen, van metaaloppervlakken en moleculaire vloeistoffen tot poreuze raamwerken, terwijl het nog steeds snel genoeg draait voor grootschalige ontdekking.

Figure 1
Figuur 1.

Waarom huidige atomaire modellen niet goed overgaan tussen domeinen

Huidige machine-learning interatomaire potentialen worden doorgaans getraind op één, zorgvuldig samengestelde databank: één voor anorganische kristallen, een andere voor geneesmiddelachtige moleculen, en weer een andere voor katalytische oppervlakken. Elke databank is opgebouwd met zijn eigen kwantumchemie-instellingen, waardoor de onderliggende energielandschappen op subtiele, niet-lineaire manieren verschillen. Deze data simpelweg aan elkaar plakken — bijvoorbeeld door energieën te verschuiven of te schalen — voegt ruis toe en leidt tot modellen die goed passen in hun thuisdomein maar falen wanneer ze onbekende chemieën of iets andere kwantummethoden moeten beschrijven. Terwijl materiaalkwesties steeds vaker domeinen mengen, zoals moleculen die reageren op vaste oppervlakken in oplossing, is dit gebrek aan overdraagbaarheid een ernstige knelpunt geworden.

Een gedeelde ruggengraat met voorzichtige specialisatie

De auteurs pakken dit aan door elke databank te behandelen als een eigen ‘taak’ in één multi‑task neuraal netwerk. Binnen het model vormt één set parameters een gedeelde ruggengraat, die algemene regels van atomaire binding vastlegt, terwijl kleinere, taakspecifieke parameters het gedrag voor specifieke datasets verfijnen. Een wiskundige analyse toont aan dat als de taakspecifieke onderdelen te groot worden, het model effectief elke databank memoriseert en vergeet te generaliseren. Om dit te voorkomen passen de auteurs selectieve regularisatie toe: ze bestraffen rechtstreeks grote taakspecifieke parameters maar laten de gedeelde ruggengraat vrij om te groeien waar nodig. Dit zet het netwerk ertoe aan om zo veel mogelijk via gemeenschappelijke fysica uit te leggen, en slechts bescheiden correcties per domein te gebruiken.

Figure 2
Figuur 2.

Werelden met elkaar verbinden met enkele sleutelvoorbeelden

Zelfs met regularisatie verschijnen sommige regio’s van de chemische ruimte slechts in één databank, waardoor de gedeelde ruggengraat daar geen richting krijgt. Om dit te verhelpen introduceert het team een ‘domein‑brugset’. Ze selecteren zorgvuldig een kleine fractie — ongeveer één op de duizend — van configuraties uit meerdere databanken en rekenen die opnieuw uit met een gemeenschappelijke kwantummechanische opzet. Deze brugstructuren werken als tweetalige zinnen in een taalleerboek: ze verbinden direct hoe twee verschillende kwantummethoden hetzelfde atomaire tafereel beschrijven. Wanneer ze in de training worden opgenomen, versterken ze de koppeling tussen taken sterk en brengen ze de energielandschappen op één lijn zonder dat alles met brute kracht opnieuw berekend hoeft te worden. Systematische tests tonen aan dat regularisatie en de brugset elkaar versterken en prestaties verbeteren tot boven wat elk afzonderlijk kan bereiken.

Een universele atomaire motor bouwen en testen

Gebaseerd op deze ideeën trainen de auteurs SevenNet‑Omni op 15 openbare datasets met in totaal ongeveer 242 miljoen atomaire structuren, die moleculen, kristallen, katalysatoren, metaal‑organische raamwerken en meerdere niveaus van kwantumtheorie omvatten. Ze benchmarken het model vervolgens in zowel vertrouwde als uitdagende situaties: kristalstabiliteit, korrelgrenzen in metalen, defecten in staal, torsiebarrières in geneesmiddelachtige moleculen, hybride organisch‑anorganische perovskieten, adsorptie in poreuze raamwerken relevant voor koolstofvangst, en reacties op metaaloppervlakken belangrijk voor waterstof‑ en kooldioxideconversie. In deze tests evenaart of overtreft SevenNet‑Omni vaak gespecialiseerde modellen die voor één domein zijn getraind, en het behoudt ‘chemische nauwkeurigheid’ voor veel reactie‑ en adsorptie-energieën. Het reproduceert ook nauwkeurig resultaten van een dure kwantummethode (r²SCAN) door te leren hoe die methode zich verhoudt tot goedkopere, meer beschikbare data.

Wat dit betekent voor de ontdekking van nieuwe materialen

Voor niet‑experts is de kernboodschap dat SevenNet‑Omni zich gedraagt als een ervaren wetenschapper die in veel subvelden heeft gewerkt. In plaats van te overfitten op één smal probleem leert het brede chemische principes en past die flexibel toe op nieuwe situaties, van gasopvang in poreuze vaste stoffen tot reacties op metalen elektroden. Het artikel laat zien dat dit mogelijk is door informatie zorgvuldig te delen tussen datasets, terwijl hun verschillen licht worden begrensd, en door een klein aantal zorgvuldig gekozen ‘vertalings’-voorbeelden tussen kwantummethoden toe te voegen. Naarmate grotere en diversere datasets blijven verschijnen, biedt deze trainingsstrategie een schaalbare route naar werkelijk universele, betrouwbare atomistische modellen die de ontdekking in chemie, fysica en materiaalkunde kunnen versnellen.

Bronvermelding: Kim, J., You, J., Park, Y. et al. Optimizing cross-domain transfer for universal machine learning interatomic potentials. Nat Commun 17, 3432 (2026). https://doi.org/10.1038/s41467-026-70195-8

Trefwoorden: machine-learning interatomaire potentialen, meerdomein materiaalkunde modellering, transfer learning, universeel atomistisch potentiaal, materialenontdekking