Clear Sky Science · ru
Эквивариантное решение диффузии для определения структуры неорганических кристаллов по данным порошковой рентгеновской дифракции
Обучая компьютеры распознавать кристаллические «отпечатки»
Многие современные технологии — от аккумуляторов до катализаторов и магнитов — зависят от точного расположения атомов в неорганических кристаллах. Эта невидимая архитектура обычно расшифровывается с помощью рентгеновских лучей, которые оставляют характерный «отпечаток» в виде дифракционной картины. Но преобразование этих картин в точную карту атомов долгое время требовало многолетнего обучения и кропотливых проб и ошибок. В этом исследовании представлена система ИИ под названием XRDSol, которая может «читать» такие отпечатки и предлагать полные кристаллические структуры менее чем за секунду, открывая путь к более быстрому поиску материалов и более надежным базам данных по материалам.
Почему порошковые паттерны так трудно расшифровать
Когда рентгеновские лучи проходят через идеально сформированный монокристалл, они создают богатую трехмерную картину, по которой можно точно определить положение каждого атома. В реальных образцах, однако, часто имеют дело с порошками, состоящими из множества мелких зерен. Их дифракционная картина сводится к одномерной последовательности пиков, при которой теряется большая часть исходной пространственной информации. Эксперты обычно вынуждены сочетать этот сжатый паттерн со своими знаниями в химии и кристаллографии, угадывая параметры ячейки, симметрию и положения атомов, а затем многократно уточняя предположения. Для сложных или плохо изученных материалов решения могут быть неполными, спорными или вовсе неверными, и крупные структурные базы данных содержат тысячи записей с отсутствующими или маловероятными координатами атомов.
ИИ, восстанавливающий атомную организацию
Авторы решают эту задачу с помощью XRDSol — модели искусственного интеллекта, основанной на эквивариантном процессе диффузии, действующем на графовом представлении кристалла. Вместо того чтобы начинать с удачной догадки, XRDSol стартует с атомов, случайно размещенных внутри известной элементарной ячейки (с известной химической формулой и параметрами решетки). Во время обучения модель учится обращать постепенный процесс «засорения шумом», при котором хорошо установившиеся, термодинамически стабильные структуры многократно искажаются. Под руководством сжатого представления целевого порошкового рентгеновского паттерна модель итеративно «удаляет шум» из случайного расположения, шаг за шагом подталкивая атомы в положения, которые одновременно химически правдоподобны и согласуются с наблюдаемой картиной. Поскольку базовая нейронная сеть учитывает вращательную и трансляционную симметрии кристаллов, она естественно отдает предпочтение физически правдоподобным конфигурациям.

Быстро и точно для множества материалов
Для тестирования XRDSol команда использовала набор данных более чем из 9000 стабильных неорганических структур с смоделированными порошковыми паттернами. На одном графическом процессоре модель генерирует решение для одной структуры примерно за 0,6 секунды — примерно в десять тысяч — сто тысяч раз быстрее, чем ранние методы, опиравшиеся на тяжелые квантово-механические расчеты и эволюционные поиски. В более чем 80 процентах случаев XRDSol восстановил положения атомов, близкие к известным структурам, а в более чем 90 процентах реконструированная дифракционная картина была сильно похожа на целевую. Метод особенно хорошо работает для кристаллов с высокой симметрией, хотя производительность падает для низкосимметричных, более сложных случаев. Тем не менее примеры от простых солей до сложных оксидов, сульфидов и интерметаллидов показывают, что подход широко применим к различным химиям.
Исправление старых записей и заполнение недостающих структур
Помимо воспроизведения известных решений, XRDSol может улучшать сомнительные записи. Авторы пересмотрели тысячи записей в базах данных с необычно высокими рассчитанными энергиями — признаком того, что в опубликованной структуре что-то не так. Используя только порошковый паттерн, параметры ячейки и состав в качестве входных данных, XRDSol предлагал альтернативные атомные расположения. По крайней мере для 39 соединений новые структуры лучше соответствовали данным дифракции и имели значительно более низкие энергии, что согласуется с более поздними экспериментальными переопределениями в нескольких хорошо изученных случаях. Система также заполнила отсутствующие координаты для 912 записей, чьи дифракционные паттерны были известны, но положения атомов отсутствовали, включая сложные примеры с легкими элементами, такими как водород и литий, природные минералы с примесями и материалы с химическим беспорядком. Эти сгенерированные ИИ структуры были проверены квантовыми расчетами и ручной инспекцией и признаны энергетически правдоподобными и химически обоснованными.

К автоматизированному открытию материалов
XRDSol демонстрирует, что основанная на диффузии нейронная сеть, учитывающая симметрию, может усвоить большую часть экспертных знаний, необходимых для решения задач определения неорганических кристаллических структур непосредственно по данным порошковой рентгеновской дифракции. Хотя метод по-прежнему испытывает трудности с очень большими элементарными ячейками, фазами с низкой симметрией и полностью неупорядоченными позициями, он уже обеспечивает быстрые, качественные начальные модели для дальнейшей доработки. На практике это означает более быструю рутинную аналитику для не специалистов, мощный инструмент для очистки и дополнения крупных структурных баз данных и ключевой компонент для лабораторий с замкнутым циклом, где компьютеры проектируют, синтезируют, характеризуют и оптимизируют новые материалы с минимальным участием человека.
Цитирование: Yu, D., Zhu, Z., Leng, F. et al. Equivariant diffusion solution for inorganic crystal structure determination from powder X-ray diffraction data. Nat Commun 17, 3274 (2026). https://doi.org/10.1038/s41467-026-70035-9
Ключевые слова: порошковая рентгеновская дифракция, определение кристаллической структуры, эквивариантная модель диффузии, информатика материалов, графовые нейронные сети