Clear Sky Science · ru
Повышение точности предсказания свойств материалов по составу с помощью перекрестной модальной передачи знаний
Почему важно предсказывать поведение материалов
Проектирование новых батарей, солнечных элементов или более прочных сплавов часто начинается с простого «рецепта», указывающего, какие элементы смешать. Превращение такого рецепта в реальный материал с известными прочностью, проводимостью или стабильностью обычно требует дорогих квантово-механических расчётов или экспериментов. В этом исследовании показано, как продвинутые языковые ИИ‑модели, изначально созданные для работы с текстом, могут учиться на многих типах данных о материалах и затем предсказывать важные свойства напрямую по химической формуле, сокращая затраты и время, необходимые для исследования огромных пространств возможных соединений.

От «рецептов» к предсказаниям
Традиционные методы машинного обучения в материаловедении делятся на два лагеря. Одна группа требует подробных кристаллических структур, описывающих расположение атомов в трех измерениях, и тогда может точно предсказывать свойства, но с высокой вычислительной стоимостью. Другая ориентируется только на общую химическую формулу, например на число атомов каждого элемента — это дешевле, но обычно менее точно. Авторы стремятся сократить этот разрыв: они хотят получить модели, которые видят только формулу, но работают почти так же хорошо, как методы, учитывающие структуру, что позволяет быстро отбирать соединения, которые ещё не были синтезированы или структурно смоделированы.
Обучение ИИ «языку» материалов
Команда опирается на химические языковые модели, которые рассматривают формулу как строку токенов, подобно словам в предложении. Сначала эти модели учатся восстанавливать пропущенные части формул — задача, помогающая уловить закономерности сочетаний элементов и их соотношений. Авторы дополнительно смещают обучение в сторону термодинамически стабильных материалов, чтобы модель больше внимания уделяла реалистичным составам. Затем они вводят ключевой поворот: вместо обучения только на текстах, как в традиционных языковых моделях, их модель выравнивается с отдельной фундаментальной моделью, которая уже обучалась на нескольких источниках, включая кристаллические структуры, электронные свойства и распределения зарядов. По сути, языковая модель перенимает богатые структурные знания, оставаясь при этом работающей только с формулами.

Два пути передачи знаний
Исследователи изучают две дополняющие друг друга стратегии, которые они называют неявной и явной перекрестной модальной передачей знаний. В неявной версии модель, основанная на формулах, обучается подгонять свои внутренние представления под представления мультимодальной фундаментальной модели, так что она «тихо» усваивает, как структура и электронные паттерны соотносятся с составом. В явной версии большая генеративная модель сначала предлагает вероятные кристаллические структуры для каждой формулы, а затем графовые нейронные сети, хорошо подходящие для работы с сетями атомов, предсказывают свойства на основе этих структур. Этот двухэтапный путь пытается восстановить отсутствующую кристаллическую информацию перед тем, как сделать предсказание.
Насколько хорошо работают методы
Модели протестированы на двух больших наборах бенчмарков, охватывающих десятки целевых величин — от запрещённых зон (band gaps), важных для солнечных элементов, до механических свойств, таких как модуль сдвига. По большей части, особенно для наборов данных на основе квантово-механических расчётов, модели с неявной передачей демонстрируют меньшую ошибку предсказания по сравнению с предыдущими языковыми моделями и часто сопоставимы с мощными методами, учитывающими структуру. Явный конвейер также улучшает результаты по сравнению с предыдущими моделями, работающими по составу, но замедляется из‑за необходимости генерировать кристаллические структуры. Генерация таких структур может занимать в десятки раз больше времени на материал, чем прямое предсказание языковой моделью, особенно для составов с большим числом различных элементов.
Заглянуть внутрь «чёрного ящика»
Чтобы понять, чему научилась языковая модель, авторы применяют теоретико-игровой анализ, который измеряет, как разные части входных данных, по отдельности или в комбинации, влияют на предсказанное свойство. При рассмотрении модуля сдвига, связанного со сопротивлением материала изменению формы, они обнаруживают, что отдельные элементы и их сочетания существенно повышают или понижают значение, что согласуется с известными жёсткими соединениями, такими как бориды и карбиды. Некоторые три‑токеновые паттерны в формуле можно даже связать с известными кристаллическими прототипами, что указывает на то, что модель неявно уловила структурные мотивы, опираясь только на состав.
Что это значит для будущих открытий материалов
В целом исследование показывает, что обмен знаниями между разными типами данных о материалах может существенно улучшить предсказание свойств при наличии только химической формулы. Неявный подход, когда языковая модель направляется мультимодальной фундаментальной моделью, даёт наилучшее сочетание точности и скорости, делая его привлекательным для крупных виртуальных скринингов новых соединений. Явный путь, реконструирующий кристаллические структуры, представляет собой ещё один перспективный вариант, особенно по мере улучшения генераторов структур. Вместе эти методы ведут к созданию ИИ‑инструментов, способных быстро просеивать огромные химические пространства и выделять наиболее перспективные кандидаты задолго до выращивания хотя бы одного кристалла.
Цитирование: Rubtsov, I., Dudakov, I., Kuratov, Y. et al. Enhancing composition-based materials property prediction by cross-modal knowledge transfer. Sci Rep 16, 16434 (2026). https://doi.org/10.1038/s41598-026-53182-3
Ключевые слова: информатика материалов, языковые модели для химии, прогнозирование свойств, мультимодальное обучение, кристаллические структуры