Clear Sky Science · ru
Контрастное обучение с KAN: ускоритель идентификации кристаллических структур по данным XRD
Почему важно более быстрое картирование кристаллов
Новые материалы для батарей, электроники и чистой энергетики часто открывают по одному кристаллу за раз. Внутренняя атомная структура каждого кристалла определяет его свойства, и учёные обычно читают эту структуру по спектрам порошковой рентгеновской дифракции (XRD) — колючим графикам, возникающим при рассеянии рентгеновских лучей на образце. Сейчас превращение этих спектров в конкретную структуру — медленный процесс, требующий большого опыта. В этой статье представлен метод машинного обучения, который быстро сопоставляет XRD‑образец с вероятными кристаллическими структурами, делая эту работу быстрее, надёжнее и проще для интеграции в автоматизированные лаборатории.
От колючих графиков к атомным чертежам
В обычной практике специалист по XRD инспектирует пики на графике, с помощью физических формул выводит возможные межатомные расстояния и затем итеративно сравнивает кандидатные структуры с данными. Этот процесс даёт сбои при наложении пиков или при большом числе схожих кандидатов и плохо масштабируется для современных высокопроизводительных экспериментов, способных выдавать тысячи спектров в день. Предыдущие инструменты машинного обучения в основном рассматривали XRD как задачу классификации — предсказание класса симметрии или групповой ячейки по паттерну — вместо прямой идентификации структуры. Новый подход, названный XRD‑Crystal Contrastive Pretraining (XCCP), переводит задачу в формат поиска: по образцу найти наиболее совместимый кристалл в большой базе данных.

Двуглазое восприятие рентгеновских паттернов
XCCP учится «видеть» данные XRD с учётом физики. Вместо того чтобы подавать весь паттерн в одну нейросеть, метод делит его на два диапазона. Одна ветвь фокусируется на малых углах, где фиксируются дальние по масштабу признаки, такие как упаковка слоёв и суперкристаллические элементы. Другая ветвь ориентируется на большие углы, где пики густые и сильнее подчиняются симметрии кристалла. Каждая ветвь обрабатывается глубокой сетью, а затем объединяется специальным проекционным модулем на основе сетей Колмогорова–Арнольда (KAN). Этот модуль особенно хорош в сосредоточении внимания на узких участках паттерна — там, где острые дифракционные пики несут наибольшее структурное содержание.
Когда паттерны и структуры встречаются посередине
На стороне структур XCCP использует графовую сеть, представляющую атомы как узлы и их связи как ребра. Во время обучения система видит множество пар: XRD‑паттерн и соответствующая ему известная кристаллическая структура. Она формирует общее числовое пространство, где каждый паттерн оказывается рядом со своей структурой и далеко от несовпадающих. Когда поступает новый паттерн, модель встраивает его в это пространство, сравнивает встраивания со всеми структурами базы и возвращает ранжированный краткий список. Без информации о присутствующих элементах правильная структура оказывается на первом месте почти в половине случаев и входит в пятёрку лучших для подавляющего большинства образцов. Если пользователь также предоставляет химический состав — данные, обычно доступные в экспериментах — совпадение на первом месте оказывается верным почти в 90% случаев.

Вглядеться в то, что видит машина
Авторы проверяют, опирается ли система на реальную физику или на случайные артефакты данных. Скрывая участки паттерна и применяя инструменты атрибуции, они показывают, что KAN‑голова принимает решения в основном на основе сильных, чётко выраженных дифракционных пиков, а не на основе широких фоновых вариаций или шума. Добавленная ветвь для малых углов последовательно улучшает результаты, особенно для кристаллов с низкой симметрией и для паттернов, где признаки на больших углах неоднозначны. Модель также демонстрирует устойчивость к типичным экспериментальным искажениям, таким как расширение пиков и небольшие сдвиги по оси угла, и довольно хорошо переносится на реальные экспериментальные наборы данных. Важно, что производимые моделью оценки схожести одновременно служат мерами доверия: они заметно падают, когда истинная структура отсутствует в базе — критическое свойство для безопасного использования в реальных условиях.
К более умному, автономному открытию материалов
Для неспециалиста главный вывод таков: XCCP превращает анализ XRD из ремесла в быстрый, основанный на данных поиск. Совмещая дифракционные паттерны и кандидатные кристаллы в общем пространстве и используя физически осведомлённую архитектуру сети, система может оперативно предложить короткий список реалистичных атомных «чертежей» с интерпретируемой степенью уверенности. Она не заменяет экспертную оценку или детальную доработку, но значительно ускоряет первый, самый тяжёлый шаг — определение того, какие структуры вообще правдоподобны. Это делает её особенно полезной для высокопроизводительных и автономных лабораторий, где роботы синтезируют новые соединения, измеряют их XRD‑паттерны, а XCCP в режиме реального времени предлагает вероятные структуры, ускоряя путь от сырых данных к новым материалам.
Цитирование: Xu, C., Su, T., Xiong, J. et al. KAN-enhanced contrastive learning: the accelerator of crystal structure identification from XRD patterns. npj Comput Mater 12, 144 (2026). https://doi.org/10.1038/s41524-026-02015-y
Ключевые слова: дифракция порошков рентгеновских лучей, идентификация кристаллической структуры, контрастное обучение, информатика материалов, сети Колмогорова–Арнольда