Clear Sky Science · de
aLLoyM: ein großes Sprachmodell zur Vorhersage von Legierungs-Phasendiagrammen
Der KI beibringen, Metallkarten zu lesen
Wenn Ingenieurinnen und Ingenieure neue Metalle für Flugtriebwerke, Batterien oder Kernreaktoren entwerfen, verlassen sie sich auf spezielle Karten, sogenannte Phasendiagramme, die zeigen, welche Elementmischungen bei verschiedenen Temperaturen fest, flüssig oder etwas dazwischen sind. Das Erstellen dieser Karten im Labor ist langsam und teuer. Diese Studie stellt ein spezialisiertes künstliches Intelligenzmodell vor, aLLoyM, das lernt, Phasendiagramme zu lesen und sogar zu skizzieren, und damit die Suche nach besseren, zäheren und effizienteren Materialien beschleunigen könnte.
Warum Phasenkarten für Alltagstechnologien wichtig sind
Phasendiagramme sind wie Wetterkarten für Metalle. Anstatt Regen oder Sonnenschein vorherzusagen, zeigen sie, wo Mischungen von Elementen schmelzen, erstarren oder unterschiedliche innere Strukturen ausbilden, wenn sich die Bedingungen ändern. Diese Details bestimmen still und leise, wie sicher eine Brücke ist, wie lange eine Turbinenschaufel Hitze aushält oder wie stabil eine Batterie über die Zeit bleibt. Aber alle möglichen Kombinationen von Elementen und Temperaturen experimentell zu erfassen, ist nahezu unmöglich, weil es unzählige Mischungen zu testen gibt und jede sorgfältiges Erhitzen, Abkühlen und Analyse erfordert. Genau in dieser Lücke zwischen dem, was wir wissen müssen, und dem, was wir tatsächlich messen können, kann KI einen echten Unterschied machen.

Daten in ein spezialisiertes Sprachmodell einspeisen
Anstatt ein weiteres enges mathematisches Modell zu bauen, feinabstimmten die Forschenden ein großes Sprachmodell — eine Art KI, die üblicherweise für Texte verwendet wird — auf die Sprache der Legierungen. Sie griffen auf eine offene Datenbank mit rechnerisch berechneten Phasendiagrammen zurück und wandelten 837.475 Datenpunkte in Frage-Antwort-Paare um. Eine typische Frage könnte lauten: „Silber 46 %, Aluminium 54 % bei 900 Kelvin: Welche Phasen treten auf?“ und die Antwort würde die vorhandenen Phasen aufzählen. Mit einer Technik namens Low-Rank-Adaptation passten sie nur einen kleinen Teil des zugrundeliegenden Mistral-Modells an, sodass es drei Aufgaben zugleich bewältigen konnte: vollständige Phasendetails vorhersagen, benennen, welche Phasen auftreten, oder eine Legierungszusammensetzung und Temperatur vorschlagen, die eine gewünschte Phase erzeugen.
Prüfen, ob die KI wirklich versteht
Um zu sehen, ob aLLoyM tatsächlich die Regeln hinter Phasendiagrammen lernte, testete das Team das Modell mit Multiple-Choice- und Freitext-(Kurzantwort-)Fragen. Bei Multiple-Choice-Aufgaben musste das Modell die richtige Antwort aus vier Optionen wählen. Das Standardmodell ohne Feinabstimmung schnitt kaum besser als zufälliges Raten ab. Nach der Feinabstimmung stieg aLLoyMs Genauigkeit für alle Aufgaben deutlich an, sowohl bei einfacheren Zwei-Element-Legierungen als auch bei komplexeren Drei-Element-Systemen. In der anspruchsvolleren Kurzantwortumgebung, in der das Modell seinen eigenen Text generieren musste statt aus einer Liste zu wählen, lieferte es dennoch Phasennamen, die den korrekten sehr nahekamen, selbst für Legierungssysteme, die es während des Trainings nie gesehen hatte. Die beste Leistung erzielte es beim Extrapolieren aus gut verstandenen Systemen; sie sank für Mischungen mit besonders kompliziertem Verhalten im mittleren Zusammensetzungsbereich — genau jene Regionen, die auch Expertinnen und Experten als schwierig empfinden.

Sich neue Materialien jenseits heutiger Experimente vorstellen
Einmal trainiert, konnte man aLLoyM bitten, Phasendiagramme für Metalle zu „zeichnen“, die schwer oder gar nicht direkt zu untersuchen sind, etwa Mischungen mit radioaktiven oder sehr kurzlebigen Elementen. Beispielsweise schätzte das Modell Schmelzpunkte und Strukturtypen für Actinium‑ und Uran‑Mischungen und schlug ternäre Diagramme für Systeme vor, die noch nicht gemessen wurden. Einige dieser Vorhersagen lagen beeindruckend nahe an bekannten Werten; andere enthielten Fehler, etwa die falsche Identifikation der stabilsten Kristallstruktur. Die Forschenden beobachteten außerdem, dass das Modell neue Phasenbezeichnungen erfindet, etwa solche mit dem Wort „WOLF“, und entwickelten Methoden, um die Zuverlässigkeit solcher Überraschungen zu prüfen, indem sie die interne Zuversicht des Modells und die Änderung seiner Antworten unter verschiedenen Sampling‑Einstellungen untersuchten.
Was das für zukünftige Materialien bedeuten könnte
Für Nicht‑Spezialisten ist die Kernbotschaft, dass aLLoyM zeigt, wie eine textbasierte KI darauf trainiert werden kann, über das Verhalten von Metallen ähnlich zu urteilen wie eine erfahrene Materialwissenschaftlerin oder ein erfahrener Materialwissenschaftler, jedoch in deutlich höherer Geschwindigkeit. Sie ist noch kein Ersatz für sorgfältige Experimente oder detailreiche physikbasierte Rechnungen und kann weiterhin selbstsichere Fehler machen. Aber mit wachsender Trainingsdatenmenge sowie verbesserten Unsicherheitsschätzungen und Eingabeaufforderungen könnten Modelle wie aLLoyM Forschende dabei unterstützen, zu entscheiden, welche Legierungsrezepte sich lohnen, im Labor getestet zu werden. Diese Orientierung könnte den langen, teuren Weg von einer Idee für ein neues Material bis zum Produkt in der Praxis verkürzen und Technologien beeinflussen — von saubereren Kraftwerken bis zu langlebigeren Konsumelektronikprodukten.
Zitation: Oikawa, Y., Deffrennes, G., Shimayoshi, R. et al. aLLoyM: a large language model for alloy phase diagram prediction. npj Comput Mater 12, 97 (2026). https://doi.org/10.1038/s41524-026-01966-6
Schlüsselwörter: Legierungs-Phasendiagramme, Materialentdeckung, große Sprachmodelle, rechnergestützte Materialwissenschaft, thermodynamische Modellierung