Clear Sky Science · ru

InSwAV: улучшенная кластеризация признаков с инволюцией и обменом назначений для классификации микроскопических изображений фарфоровых реликвий

2026-02-24 · Назад к списку

Почему разбитый фарфор важен для настоящего

По всей Китаю и за его пределами археологические раскопки выявляют горы разбитого фарфора. Каждая крошка несёт подсказки о том, как жили люди, как торговали и как совершенствовали обжиг при высоких температурах столетия назад. В то же время сортировка и подбор этих бесчисленных осколков остаются медлительной работой специалистов. В этом исследовании предложен новый подход искусственного интеллекта, названный InSwAV, который обучается на микроскопических изображениях поверхностей фарфора, чтобы автоматически группировать фрагменты по типу. Более быстрая и надёжная классификация может существенно ускорить реставрационные работы и углубить наше понимание культурного наследия.

Видеть историю в крошечных пузырьках

Невооружённым взглядом многие фарфоровые изделия кажутся схожими: белая или бледно‑зелёная глазурь, стёртые узоры и повреждённые края. Под микроскопом же открывается другой мир. Крошечные пузырьки, запечатанные в глазури, фиксируют сведения о глине, рецептуре глазури, температуре обжига и даже о привычках отдельных печей или мастерских. Предыдущие исследования показали, что размер, форма и распределение этих пузырьков различаются между центрами производства и эпохами, что делает их мощными «отпечатками» для идентификации и датировки. Однако извлечение и интерпретация этих тонких шаблонов вручную или с помощью традиционных инструментов обработки изображений трудоёмки и чувствительны к шуму.

Дать компьютеру возможность учиться самому

Главная преграда в этой области — нехватка размеченных данных: специалисты могут аннотировать лишь ограниченное число микроскопических изображений, а некоторые типы фрагментов встречаются редко. Вместо полагания на тысячи примеров с экспертными метками авторы используют метод самоконтролируемого (self‑supervised) обучения, где нейросеть обучается обнаруживать структуру в данных самостоятельно. Они собрали датасет Porcelain Relic Microscopic Image (PRMI), содержащий 7425 изображений при высоком увеличении из пяти категорий фарфора. Для каждого исходного микрофотографического изображения система создаёт несколько изменённых версий — обрезки, развороты, небольшие изменения цвета и размытия. Эти «виды» показывают один и тот же материал по‑разному, побуждая компьютер сосредоточиться на устойчивых, значимых признаках вместо поверхностных деталей.

Более умный способ замечать закономерности

Сердцем метода является InSwAV — сеть, построенная вокруг кастомного извлекателя признаков под названием ResInv. Стандартные свёрточные сети используют фиксированные фильтры, которые скользят по изображению. ResInv, напротив, комбинирует их с операциями «инволюции», которые адаптируют своё поведение в зависимости от позиции, что лучше захватывает нерегулярные многошкальные формы пузырьков глазури и трещин. После того как ResInv преобразует каждое изображение в компактный сигнатурный вектор, InSwAV не сравнивает отдельные изображения напрямую. Вместо этого он назначает их множеству изученных «прототипов» или центров кластеров и затем проверяет, попадают ли разные аугментированные виды одного и того же фрагмента в совместимые кластеры. Математический шаг балансировки препятствует ленивому сведению всего к нескольким группам, заставляя модель выявлять настоящую, более тонкую структуру.

Точность, скорость и то, что они показывают

На датасете PRMI InSwAV правильно различает пять категорий фарфора в 96.2% случаев, явно опережая несколько ведущих методов самоконтролируемого обучения и даже сильную контролируемую (supervised) базовую модель, имевшую доступ к меткам. Он также обучается значительно быстрее, достигая высокой точности всего за несколько часов на современной графической аппаратуре. Визуализации внутренней активности сети показывают, что ResInv концентрируется на пузырьках и ключевых микроструктурных деталях, тогда как стандартная архитектура склонна отвлекаться на фоновые области. Подход также устойчив к разным выборам числа кластеров, которые использует модель, что говорит о хорошей адаптивности к новым наборам данных.

Что это значит для разбитой посуды и не только

Проще говоря, исследование демонстрирует, что компьютер может научиться различать фарфоровые реликвии по их микроскопическим «пейзажам пузырьков», даже когда эксперты предоставляют мало меток. Эта возможность может помочь музеям и археологам быстрее сортировать большие коллекции, подбирать фрагменты для виртуальной сборки и поддерживать исследования технологий печей и торговых сетей. Авторы планируют расширять свой датасет, тестировать метод на более широких коллекциях изображений и дальше оптимизировать модель для полевого применения. По мере созревания таких инструментов хрупкие осколки могут превратиться из трудоёмких головоломок в богатые, быстро доступные свидетельства прошлого.

Цитирование: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Ключевые слова: фарфоровые реликвии, микроскопическая визуализация, самостоятельное обучение, реставрация культурного наследия, классификация изображений