Clear Sky Science · ru

Неконтролируемая кластеризация дефектов в атомно-разрешающей микроскопии с использованием сверточного вариационного автоэнкодера

· Назад к списку

Почему важны крошечные дефекты в кристаллах

Современная электроника, солнечные элементы и сенсоры зависят от материалов, которые на атомном уровне выглядят идеально упорядоченными. На самом деле каждый кристалл усеян мелкими несовершенствами — отсутствующими атомами, лишними атомами или небольшими смещениями в решётке — которые могут либо повысить эффективность устройства, либо незаметно её погубить. В статье, кратко изложенной здесь, предложен метод, позволяющий искусственному интеллекту автоматически искать такие дефекты на высокоразрешённых микроскопических изображениях без разметки человеком или тонкой ручной настройки, что открывает путь к более быстрой и менее предвзятой разведке материалов.

Figure 1
Figure 1.

Обучить компьютер тому, как выглядит «идеал»

Исследователи исходят из простой идеи: вместо того чтобы обучать компьютер каждому возможному типу дефекта, научить его только тому, как выглядит идеальный кристалл. Они используют атомно-разрешающие изображения, полученные мощным электронным микроскопом, где каждая яркая точка соответствует столбику атомов. Специальный тип нейронной сети, называемый сверточным вариационным автоэнкодером, обучают на участках изображения, считающихся свободными от дефектов. Со временем сеть усваивает регулярный, повторяющийся рисунок кристалла и становится очень хорошей в восстановлении того, как должна выглядеть идеальная, неиспорченная решётка.

Преобразование различий в карту дефектов

Когда сеть научилась идеальному шаблону, через неё пропускают каждый новый фрагмент микроскопического изображения. Модель выдаёт свою лучшую попытку восстановления бездефектного варианта этого фрагмента. Вычитая это предсказание из реального изображения, метод получает «картинку различий», которая выделяет только то, что не вписывается в изученный шаблон — например, лишний атом, отсутствующую пару атомов или смещение в укладке. Дальнейший шаг фильтрации удаляет случайный шум и артефакты по краям, оставляя чистый сигнал, фокусирующийся на подлинных структурных аномалиях, а не на том, как был вырезан фрагмент изображения. По сути система перекладывает задачу с «научиться всем возможным дефектам» на «находить всё, что не является нормой».

От сырых изображений к осмысленным группам

Чтобы распределить дефекты по полезным категориям, команда преобразует каждый фрагмент в набор из 47 простых числовых дескрипторов. Они описывают среднюю яркость фрагмента, асимметрию распределения интенсивности, количество резких признаков и то, как узоры повторяются в пространстве, среди прочих характеристик. Далее этот список сокращают в три этапа: удаляют избыточные дескрипторы, которые ведут себя почти одинаково; отбрасывают те, что не разделяют изображения на различимые группы; и фильтруют те, которые почти не изменяются. В результате остаётся более компактный и информативный набор признаков, который лучше ловит реальные структурные различия и уменьшает шум и вычислительную нагрузку.

Дать данным решать, сколько типов дефектов существует

Имея эти уточнённые признаки, авторы применяют стандартные инструменты кластеризации, позволяющие данным организоваться самостоятельно. Сначала они сжимают пространство признаков с помощью метода главных компонент (PCA), который сохраняет наиболее важные вариации при уменьшении числа измерений. Затем многократно запускают классический метод кластеризации k‑means, систематически меняя как число кластеров, так и число главных компонент. Метрика качества, называемая silhouette score, показывает, насколько хорошо отделены получившиеся группы. Просканировав варианты, фреймворк автоматически определяет не только расположение кластеров, но и оптимальное число типов дефектов, описывающих набор данных — без предварительных меток или ручных выборов.

Figure 2
Figure 2.

Доказательство работоспособности на двух разных кристаллах

Метод протестирован на изображениях двух хорошо изученных материалов: теллурида кадмия, используемого в тонкоплёночных солнечных модулях, и стронция титаната, модельного оксидного кристалла. В наборе данных для теллурида кадмия есть участки объёма, несколько типов сдвигов укладки (stacking faults), особые структуры дислокаций и границы двойников, а также искусственно добавленные лишние и отсутствующие атомы. Несмотря на тонкие различия в контрасте и отвлекающие краевые эффекты, фреймворк автоматически восстанавливает семь различных кластеров, соответствующих этим категориям, с лишь несколькими ошибками среди более чем тысячи изображений. Применённый к стронция титанату, где некоторые дефекты отличаются от идеальной решётки лишь незначительно, тот же рабочий процесс вновь находит правильное число групп и сортирует изображения с высокой точностью, показывая, что подход не адаптирован избирательно к одному материалу.

Что это значит для будущих исследований материалов

Проще говоря, исследование показывает, что компьютер может самостоятельно научиться обнаруживать и группировать дефекты на атомном уровне в микроскопических изображениях при минимальном участии человека. Обучаясь нормальному шаблону кристалла и фокусируясь на отличиях, система способна просеивать большие коллекции изображений, выявлять разные типы несовершенств и делать это на обычных лабораторных компьютерах. Такой неконтролируемый автоматический отбор может помочь учёным быстро картировать распределение дефектов в образце и их связь с характеристиками, закладывая основу для более автономного, управляемого данными проектирования и оптимизации материалов следующего поколения.

Цитирование: Ayyubi, R.A.W., Sultanov, S., Buban, J.P. et al. Unsupervised defect clustering in atomic-resolution microscopy using a convolutional variational autoencoder. npj Comput Mater 12, 166 (2026). https://doi.org/10.1038/s41524-026-02024-x

Ключевые слова: атомные дефекты, электронная микроскопия, неконтролируемое обучение, автоэнкодеры, характеризация материалов