Clear Sky Science · de

Ein multimodales großes Sprachmodell für die Materialwissenschaft

· Zurück zur Übersicht

Warum neue Materialien für den Alltag wichtig sind

Von besseren Handy-Akkus über effizientere Solarmodule bis hin zu schnelleren Computern: Viele Technologien der Zukunft hängen davon ab, neue Materialien zu entdecken und zu optimieren. Herauszufinden, welche Atomkombinationen genau die gewünschten Eigenschaften ergeben, ist jedoch wie die Suche nach einer Nadel in einem kosmisch großen Heuhaufen. Dieser Artikel stellt MatterChat vor, ein System der künstlichen Intelligenz, das mit Forschenden in Alltagssprache kommunizieren kann und zugleich die detaillierte atomare Struktur von Materialien "sieht". Es hilft dabei, vorherzusagen, wie Materialien sich verhalten und wie sie im Labor hergestellt werden könnten.

Figure 1
Figure 1.

Ein digitaler Assistent, der Atome sieht und Worte liest

MatterChat ist darauf ausgelegt, zwei sehr unterschiedliche Informationsarten zu kombinieren: die präzise 3D-Anordnung der Atome in einem Festkörper und die textbasierten Fragen und das Wissen, das Forschende verwenden. Auf der einen Seite verarbeitet das System eine Kristallstruktur, die als Netzwerk von Atomen und Bindungen dargestellt werden kann. Diese wird durch leistungsfähige, physik-inspirierte Modelle geleitet, die an Hunderttausenden bekannter Materialien trainiert wurden, um kompakte numerische Fingerabdrücke für jedes Atom und sein Umfeld zu erzeugen. Auf der anderen Seite übersetzt ein großes Sprachmodell — basierend auf dem quelloffenen Mistral-7B-System — die Frage eines Nutzers, etwa zur Stabilität oder zum elektronischen Verhalten, in seine eigene interne Repräsentation. Ein speziell entwickeltes "Bridge"-Modul lernt dann, wie diese beiden Welten so ausgerichtet werden, dass das Sprachmodell direkt über das Verhalten der Atome schlussfolgern kann.

Das System mit einem reichen Materialkatalog lehren

Zum Training von MatterChat griffen die Autoren auf eine umfangreiche Datenbank mit 142.899 anorganischen Materialien aus dem Materials Project zurück. Für jedes Material nutzten sie nicht nur die vollständige atomare Struktur, sondern auch zwölf Arten beschreibender Informationen. Diese reichten von grundlegenden Identifikatoren wie chemischer Formel, Symmetrietyp und Kristallfamilie bis hin zu neun Schlüsselgrößen, darunter ob das Material metallisch oder isolierend ist, seine elektronische Bandlücke, magnetisches Verhalten und verschiedene Maße thermodynamischer Stabilität. Indem jede Struktur mit vielen textartigen Fragen und Antworten zu diesen Eigenschaften gepaart wurde, lernte das System, Muster in atomaren Anordnungen mit den Worten zu verbinden, die Forschende zur Beschreibung und Analyse von Materialien verwenden.

Von einfachen Nachschlägen zu wissenschaftsähnlichem Schließen

Einmal trainiert, kann MatterChat mehr als nur Datenbankeinträge wiedergeben. Wenn ein Nutzer eine Struktur bereitstellt, kann das System eine große Bandbreite an Fragen beantworten, etwa die Formel identifizieren, abschätzen, ob das Material im Labor existieren sollte, oder Energien schätzen, die normalerweise aufwändige quantenmechanische Rechnungen erfordern. Die Autoren zeigen Beispiele, in denen MatterChat detaillierte Einschätzungen zu spezifischen Materialien liefert, einschließlich Kommentaren zu Stabilität, elektronischen Bandlücken und Magnetismus. In einigen Fällen geht es noch weiter und generiert plausible schrittweise Laborprotokolle zur Herstellung bekannter Verbindungen wie Galliumnitrid und Yttrium-Eisen-Granat, wobei es auf das allgemeine wissenschaftliche Wissen seines Sprachmodells zurückgreift und seine Antworten mit der gelieferten Kristallstruktur untermauert.

Figure 2
Figure 2.

Allgemeine Chatbots bei harten Zahlen übertreffen

Ein auffälliges Ergebnis ist, dass MatterChat bei der Vorhersage quantitativer Materialeigenschaften sowohl traditionelle Sprachmodelle als auch mehrere spezialisierte physikbasierte Machine-Learning-Werkzeuge übertrifft. In neun Benchmark-Aufgaben ist es beispielsweise genauer darin zu entscheiden, ob ein Festkörper metallisch, stabil oder magnetisch ist. Bei kontinuierlichen Größen wie der Bildungsenergie oder der Bandlücke liegen seine Vorhersagen näher an den Werten aus aufwändigen Computersimulationen. Dies gilt auch, wenn das System an einer separaten Sammlung neu entdeckter Verbindungen aus dem GNoME-Projekt getestet wird, die nicht im Training verwendet wurden. Die Autoren analysieren zudem die internen Repräsentationen des Systems und zeigen, dass ähnliche Strukturen zusammenclustern und dass Änderungen in der Stabilität sich gleichmäßig über diese interne Karte verfolgen lassen — ein Hinweis darauf, dass das Modell chemisch sinnvolle Muster gelernt hat.

Was das für die Entdeckung neuer Materialien bedeuten könnte

Für Nichtfachleute ist die wichtigste Erkenntnis, dass MatterChat wie ein Gesprächspartner wirkt, der sowohl wissenschaftliche Sprache versteht als auch ein detailliertes Gespür dafür hat, wie Atome in Festkörpern angeordnet sind. Durch die Verschmelzung dieser Fähigkeiten kann es schnell Fragen beantworten, die früher Expertenintuition und teure Rechnungen erforderten, und es kann realistische Syntheserouten für vielversprechende Kandidaten vorschlagen. Obwohl die Autoren anmerken, dass das System bei extrem präzisen Zahlen noch Schwierigkeiten hat und gelegentlich übermäßig selbstsichere Vermutungen anstellt, sehen sie in seinem modularen Aufbau und der starken Leistungsfähigkeit einen wichtigen Schritt hin zu KI-Werkzeugen, die Forschenden helfen, den riesigen Raum möglicher Materialien zu navigieren und den Weg von Ideen zu funktionierenden Technologien zu beschleunigen.

Zitation: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

Schlüsselwörter: Materialentdeckung, multimodale KI, Kristallstrukturen, Eigenschaftsvorhersage, wissenschaftliche Chatbots