Clear Sky Science · nl
Een multimodaal groot taalmodel voor materiaalkunde
Waarom nieuwe materialen belangrijk zijn voor het dagelijks leven
Van betere telefoonaccu’s tot efficiëntere zonnepanelen en snellere computers: veel technologieën van morgen hangen af van het ontdekken en perfectioneren van nieuwe materialen. Maar uitzoeken welke combinaties van atomen precies de gewenste eigenschappen geven, is als het zoeken naar naalden in een kosmische hooiberg. Dit artikel presenteert MatterChat, een kunstmatig-intelligentiesysteem dat met wetenschappers praat in alledaagse taal en tegelijkertijd de gedetailleerde atomaire structuur van materialen kan “zien”, om te helpen voorspellen hoe ze zich gedragen en hoe ze in het lab gemaakt zouden kunnen worden.

Een digitale assistent die atomen ziet en woorden leest
MatterChat is ontworpen om twee zeer verschillende soorten informatie te combineren: de precieze 3D-ordening van atomen in een vaste stof en de tekstgebaseerde vragen en kennis die wetenschappers gebruiken. Aan de ene kant verwerkt het systeem een kristalstructuur, die kan worden weergegeven als een netwerk van atomen en bindingen. Dit wordt door krachtige, door de natuurkunde geïnspireerde modellen gehaald die zijn getraind op honderden duizenden bekende materialen om compacte numerieke vingerafdrukken van elk atoom en zijn omgeving te produceren. Aan de andere kant zet een groot taalmodel—gebaseerd op het open-source Mistral 7B-systeem—de vraag van een gebruiker, bijvoorbeeld over stabiliteit of elektronisch gedrag, om in zijn eigen interne representatie. Een speciaal ontworpen “brug”-module leert vervolgens hoe deze twee werelden op één lijn te brengen, zodat het taalmodel direct kan redeneren over wat de atomen doen.
Het systeem trainen met een rijk materiaalarchief
Voor het trainen van MatterChat maakten de auteurs gebruik van een grote database met 142.899 anorganische materialen uit het Materials Project. Voor elk materiaal gebruikten ze niet alleen de volledige atomaire structuur, maar ook twaalf soorten beschrijvende informatie. Die varieerden van basisidentificatoren zoals de chemische formule, symmetrie-type en kristalfamilie tot negen kern-eigenschappen, waaronder of het materiaal metallisch of isolerend is, de elektronische bandgap, magnetisch gedrag en meerdere maten voor thermodynamische stabiliteit. Door elke structuur te koppelen aan vele tekstachtige vragen en antwoorden over deze eigenschappen, leerde het systeem patronen in atomaire ordeningen te verbinden met de woorden die wetenschappers gebruiken om materialen te beschrijven en te analyseren.
Van simpele opzoekingen tot redeneren in wetenschappelijke stijl
Eenmaal getraind kan MatterChat meer dan alleen database-invoer herhalen. Wanneer een gebruiker een structuur levert, kan het systeem een breed scala aan vragen beantwoorden, zoals het identificeren van de formule, inschatten of het materiaal in het lab zou moeten bestaan, of het schatten van energieën die normaal zware kwantummechanische berekeningen vereisen. De auteurs tonen voorbeelden waarin MatterChat gedetailleerde beoordelingen van specifieke materialen produceert, inclusief opmerkingen over stabiliteit, elektronische gaps en magnetisme. In sommige gevallen gaat het verder en genereert het plausibele stap-voor-stap labrecepten voor het maken van bekende verbindingen zoals galliumnitride en yttrium-ijzer-garnaat, waarbij het algemene wetenschappelijke kennis uit zijn taalmodel gebruikt en zijn antwoorden baseert op de aangeleverde kristalstructuur.

Algemene chatbots overtreffen op harde cijfers
Een opvallend resultaat is dat MatterChat beter is in het voorspellen van kwantitatieve materiaaleigenschappen dan zowel traditionele taalmodellen als meerdere gespecialiseerde fysica-gebaseerde machine-learningtools. Over negen benchmarktaken is het nauwkeuriger bij het bepalen of een stof bijvoorbeeld metallisch, stabiel of magnetisch is. Voor continue grootheden zoals formatiesenergie of bandgap liggen de voorspellingen dichter bij de waarden die uit veeleisende computersimulaties komen. Dit geldt zelfs wanneer het getest wordt op een aparte verzameling nieuw ontdekte verbindingen uit het GNoME-project, die niet in de training waren opgenomen. De auteurs analyseren ook de interne representaties van het systeem en tonen aan dat vergelijkbare structuren bij elkaar clusteren en dat veranderingen in stabiliteit soepel volgen over deze interne kaart, wat aangeeft dat het model chemisch zinvolle patronen heeft geleerd.
Wat dit kan betekenen voor het ontdekken van nieuwe materialen
Voor niet-specialisten is de belangrijkste conclusie dat MatterChat fungeert als een gesprekspartner die zowel wetenschappelijke taal begrijpt als een gedetailleerd beeld heeft van hoe atomen in vaste stoffen gerangschikt zijn. Door deze vermogens te combineren kan het snel vragen beantwoorden die vroeger deskundige intuïtie en dure berekeningen vergden, en het kan realistische syntheseroutes voorstellen voor veelbelovende kandidaten. Hoewel de auteurs opmerken dat het systeem nog moeite heeft met extreem precieze getallen en soms overmoedig kan gokken, stellen ze dat het modulaire ontwerp en de sterke prestaties een belangrijke stap markeren richting AI-tools die wetenschappers helpen de enorme ruimte van mogelijke materialen te verkennen en de weg van idee naar werkende technologieën te versnellen.
Bronvermelding: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y
Trefwoorden: materiaalontdekking, multimodale AI, kristalstructuren, eigenschap voorspelling, wetenschappelijke chatbots