Clear Sky Science · ru
Мультимодальная большая языковая модель для материаловедения
Почему новые материалы важны в повседневной жизни
От более ёмких аккумуляторов для телефонов до более эффективных солнечных панелей и быстрых компьютеров — многие технологии будущего зависят от открытия и совершенствования новых материалов. Однако выяснить, какие сочетания атомов дадут нужные свойства, подобно поиску игл в космическом стоге сена. В этой статье представлен MatterChat — система искусственного интеллекта, созданная для общения с учёными на повседневном языке и одновременно «видящая» детальную атомную структуру материалов, помогая предсказывать их поведение и то, как их можно синтезировать в лаборатории.

Цифровой помощник, который видит атомы и читает слова
MatterChat создан для объединения двух очень разных видов информации: точного 3D-расположения атомов в твёрдом теле и текстовых вопросов и знаний, которые используют учёные. С одной стороны система принимает кристаллическую структуру, которую можно представить как сеть атомов и связей. Она пропускает её через мощные физически мотивированные модели, обученные на сотнях тысяч известных материалов, чтобы получить компактные числовые отпечатки для каждого атома и его окружения. С другой стороны большая языковая модель — основанная на открытой Mistral 7B — превращает вопрос пользователя, например о стабильности или электронных свойствах, в собственное внутреннее представление. Специально разработанный модуль «моста» затем учится выравнивать эти два мира, чтобы языковая модель могла прямо рассуждать о том, что делают атомы.
Обучение системы на богатом каталоге материалов
Для обучения MatterChat авторы использовали большую базу данных, содержащую 142 899 неорганических материалов из Materials Project. Для каждого материала они использовали не только полную атомную структуру, но и двенадцать типов описательной информации. Это варьировалось от базовых идентификаторов, таких как химическая формула, тип симметрии и кристаллическое семейство, до девяти ключевых свойств, включая металл ли материал или изолятор, его электронную запрещённую зону, магнитное поведение и несколько показателей термодинамической устойчивости. Сопоставляя каждую структуру с множеством вопросов и ответов в текстовом формате о этих свойствах, система научилась связывать закономерности в атомных укладках со словами, которые учёные используют для описания и анализа материалов.
От простых запросов к научному рассуждению
После обучения MatterChat умеет не только повторять записи из базы данных. Когда пользователь предоставляет структуру, система может ответить на широкий круг вопросов: например определить формулу, предположить, может ли материал существовать в лабораторных условиях, или оценить энергии, которые обычно требуют тяжёлых квантово-механических расчётов. Авторы приводят примеры, где MatterChat даёт детальные оценки конкретных материалов, включая замечания о стабильности, электронных зазорах и магнетизме. В некоторых случаях он идёт дальше, генерируя правдоподобные пошаговые лабораторные рецепты синтеза известных соединений, таких как нитрид галлия или гранат иттрий-железо, опираясь на общий научный багаж, закодированный в языковой модели, и одновременно связывая ответы с предоставленной кристаллической структурой.

Превосходство над универсальными чат-ботами в точных показателях
Поразительный результат в том, что MatterChat превосходит как традиционные языковые модели, так и несколько специализированных физических моделей машинного обучения в задаче предсказания количественных свойств материалов. По девяти эталонным задачам он точнее определяет, например, является ли твёрдое тело металлическим, стабильным или магнитным. Для непрерывных величин, таких как энергия образования или ширина запрещённой зоны, его предсказания ближе к значениям, полученным в ресурсоёмких компьютерных симуляциях. Это справедливо даже при проверке на отдельной коллекции недавно открытых соединений из проекта GNoME, не использованных в обучении. Авторы также анализируют внутренние представления системы и показывают, что схожие структуры группируются вместе, а изменения стабильности плавно отслеживаются на этой внутренней карте, что говорит о том, что модель выучила химически значимые закономерности.
Что это может означать для поиска новых материалов
Для неспециалистов главный вывод таков: MatterChat действует как партнёр по беседе, который одновременно понимает научный язык и обладает детальным ощущением того, как устроены атомы в твёрдых телах. Слияние этих способностей позволяет быстро отвечать на вопросы, которые раньше требовали экспертной интуиции и дорогостоящих расчётов, а также предлагать реалистичные пути синтеза для перспективных кандидатов. Хотя авторы отмечают, что система всё ещё с трудом справляется с экстремально точными числовыми значениями и иногда может делать самоуверенные ошибочные предположения, они утверждают, что модульная архитектура и высокая производительность обозначают важный шаг к инструментам ИИ, помогающим учёным ориентироваться в огромном пространстве возможных материалов и ускорять путь от идеи до рабочих технологий.
Цитирование: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y
Ключевые слова: поиск материалов, мультимодальный ИИ, кристаллические структуры, предсказание свойств, научные чат-боты