Clear Sky Science · sv

En multimodal stor språkmodell för materialvetenskap

· Tillbaka till index

Varför nya material spelar roll i vardagen

Från bättre telefonbatterier till effektivare solpaneler och snabbare datorer beror många av morgondagens teknologier på att upptäcka och förfina nya material. Att lista ut vilka atomkombinationer som ger precis rätt egenskaper är emellertid som att leta efter nålar i en kosmiskt stor höstack. Den här artikeln presenterar MatterChat, ett artificiellt intelligenssystem designat för att samtala med forskare på vardagligt språk samtidigt som det ”ser” materialens detaljerade atomära struktur, och hjälper till att förutsäga hur de beter sig och hur de kan framställas i laboratorium.

Figure 1
Figure 1.

En digital assistent som ser atomer och läser ord

MatterChat är konstruerat för att kombinera två mycket olika sorters information: den precisa 3D-ordningen av atomer i ett fast material och de textbaserade frågor och den kunskap som forskare använder. Å ena sidan tar systemet en kristallstruktur, som kan representeras som ett nätverk av atomer och bindningar. Den bearbetas av kraftfulla fysikinspirerade modeller som tränats på hundratusentals kända material för att skapa kompakta numeriska fingeravtryck för varje atom och dess omgivning. Å andra sidan omvandlar en stor språkmodell—baserad på den öppna källkodsmodellen Mistral 7B—en användares fråga, till exempel om stabilitet eller elektroniskt beteende, till sin egen interna representation. En särskilt utformad ”brygga”-modul lär sig sedan hur dessa två världar ska anpassas så att språkmodellen kan resonera direkt kring vad atomerna gör.

Att lära systemet med en rik materialkatalog

För att träna MatterChat använde författarna en stor databas som innehåller 142 899 oorganiska material från Materials Project. För varje material använde de inte bara den fullständiga atomstrukturen utan också tolv typer av beskrivande information. Dessa sträckte sig från grundläggande identifierare såsom kemisk formel, symmetrityp och kristallfamilj till nio nyckelegenskaper inklusive om materialet är metalliskt eller isolerande, dess elektroniska bandgap, magnetiskt beteende och flera mått på termodynamisk stabilitet. Genom att para varje struktur med många textliknande frågor och svar om dessa egenskaper lärde sig systemet att koppla mönster i atomarrangemang till de ord forskare använder för att beskriva och analysera material.

Från enkla uppslag till vetenskapsliknande resonemang

När det väl är tränat kan MatterChat göra mer än att bara upprepa databasposter. När en användare tillhandahåller en struktur kan systemet svara på ett brett spektrum frågor, såsom att identifiera formeln, gissa om materialet bör kunna existera i laboratoriet eller uppskatta energier som normalt kräver tunga kvantmekaniska beräkningar. Författarna visar exempel där MatterChat producerar detaljerade bedömningar av specifika material, inklusive kommentarer om stabilitet, elektroniska gap och magnetism. I vissa fall går det längre och genererar plausibla steg-för-steg-laboratorierecept för att framställa välkända föreningar som galliumnitrid och yttriumjärnspagat, genom att dra nytta av den generella vetenskapliga kunskap som finns i språkmodellen samtidigt som svaren förankras i den levererade kristallstrukturen.

Figure 2
Figure 2.

Slår allmänna chattbottar på hårda siffror

Ett slående resultat är att MatterChat presterar bättre när det gäller att förutsäga kvantitativa materialegenskaper än både traditionella språkmodeller och flera specialiserade fysikbaserade maskininlärningsverktyg. Över nio referensuppgifter är det mer träffsäkert i att avgöra till exempel om ett fast ämne är metalliskt, stabilt eller magnetiskt. För kontinuerliga storheter såsom formationsenergi eller bandgap ligger dess förutsägelser närmare de värden som erhålls från krävande datorsimuleringar. Detta gäller även när det testas på en separat samling nyligen upptäckta föreningar från GNoME-projektet, som inte användes under träningen. Författarna analyserar också systemets interna representationer och visar att liknande strukturer klustras tillsammans och att förändringar i stabilitet följer ett jämnt mönster över denna interna karta, vilket indikerar att modellen lärt sig kemiskt meningsfulla samband.

Vad detta kan innebära för upptäckten av nya material

För icke-specialister är huvudsaken att MatterChat fungerar som en samtalspartner som både förstår vetenskapligt språk och har en detaljerad känsla för hur atomer är ordnade i fasta ämnen. Genom att förena dessa förmågor kan det snabbt besvara frågor som tidigare krävde expertintuition och dyra beräkningar, och det kan föreslå realistiska syntesvägar för lovande kandidater. Även om författarna noterar att systemet fortfarande har svårigheter med extremt precisa tal och ibland kan gissa överdrivet självsäkert, menar de att dess modulära design och starka prestanda utgör ett viktigt steg mot AI-verktyg som hjälper forskare att navigera i det stora utrymmet av möjliga material och snabbar upp vägen från idéer till fungerande teknologier.

Citering: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

Nyckelord: materialupptäckt, multimodal AI, kristallstrukturer, egenskapsprognoser, vetenskapliga chattbottar