Clear Sky Science · ru

PBDWNet: многомасштабная сеть сегментации пузырьков на фарфоровой поверхности на основе частотной слияния и деформируемой осведомлённости признаков

· Назад к списку

Скрытые подсказки в древнем фарфоре

Когда археологи откапывают осколки древнего фарфора, они по сути находят крошечные временные капсулы. В стекловидной глазури каждого фрагмента заперты микроскопические пузырьки, которые тихо записывают, как и где был изготовлен предмет. Однако чтение этих пузырьков крайне сложно для человеческого глаза и для обычных компьютерных программ. В этом исследовании представлена специализированная система искусственного интеллекта PBDWNet, разработанная для точного обнаружения и трассировки этих крошечных пузырьков, открывая новые возможности датировки, классификации и понимания культурных реликвий.

Почему мелкие пузырьки имеют значение

Фарфор — это не только красивая посуда; это материальный архив китайской цивилизации и её глобальной торговли. Традиционный анализ осколков опирается на видимые признаки — форму, цвет и роспись — и потому требует многолетнего опыта специалистов. Но на многих раскопках фрагменты малы, изношены или внешне похожи, что затрудняет определение места и времени производства. Микроскопические пузырьки в глазури предлагают объективную альтернативу. Их размер, форма, плотность и пространственное распределение меняются в зависимости от исходных материалов, температуры обжига, толщины глазури и атмосферы в печи. Тщательно измеряя эти закономерности, исследователи могут строить «микро-отпечатки», помогающие установить происхождение фрагмента и технологию его изготовления.

Figure 1
Figure 1.

Проблема видения невидимого

Хотя пузырьки в глазури богаты информацией, их крайне трудно обнаружить. Под микроскопом пузырьки малы, имеют низкую контрастность и часто сливаются с шумным, текстурным фоном. Классические приёмы обработки изображений — простые пороги, детекторы краёв или геометрические операции — склонны разрушать их контуры, путать с фоновыми узорами или пропускать самые мелкие экземпляры. Даже современные методы глубокого обучения, успешно работающие с обычными фотографиями, здесь испытывают трудности, поскольку они не настроены на слабые, неправильной формы структуры на сложных керамических поверхностях. Они часто теряют тонкие детали, игнорируют едва заметные границы и легко отвлекаются бликами или шероховатостью глазури.

Трёхпутевая сеть, созданная для пузырьков

PBDWNet — это специально разработанная нейросеть, которая решает эти проблемы, обрабатывая изображение тремя согласованными путями. Основной путь базируется на проверенной глубокой архитектуре, которая постепенно преобразует исходное микроскопическое изображение в богатое внутреннее представление, сохраняя относительно высокое разрешение. Поверх этого авторы добавляют ветвь «деформируемой осведомлённости признаков», которая позволяет сети изгибать свою сетку выборки вокруг неправильных форм реальных пузырьков. Вместо того чтобы смотреть жёстким квадратным окном, она может растягиваться и смещаться, чтобы следовать изогнутым контурам, точнее фокусируясь на самом пузырьке.

Параллельно ветвь «вейвлет» разлагает изображение на низко- и высокочастотные компоненты, примерно соответствующие общей структуре и резким краям. Такой частотный взгляд позволяет модели сохранять общую структуру глазури, одновременно подчёркивая тонкие кромки пузырьков и другую мелкую текстуру, а также подавлять шум, не характерный для пузырьковых образований. Тщательно спроектированные этапы слияния затем рекомбинируют информацию из всех трёх путей, так что глобальный контекст, детализированные формы и чёткие края усиливают друг друга, а не конкурируют. Сеть обучается в конфигурации с двумя выходами, что направляет как промежуточные, так и конечные предсказания быть точными на уровне отдельных пикселей.

Figure 2
Figure 2.

Проверка метода

Для оценки PBDWNet исследователи использовали специализированный набор данных изображений фарфоровых осколков под высоким увеличением, собранных и экспертно размеченных в Северо-Западном университете. Этот набор, названный PRMI, охватывает широкий диапазон размеров пузырьков, их плотности и внешнего вида поверхности. Команда сравнила свою модель с десятью ведущими системами сегментации, широко применяемыми в компьютерном зрении. По стандартным метрикам точности и перекрытия предсказанных форм пузырьков с человеческими контурами PBDWNet последовательно показывала лучшие результаты, достигая наивысшего общего F1‑балла и наилучшего пересечения по объединению (IoU) как для пузырьков, так и для фона. Визуальные сравнения демонстрируют, что модель сохраняет целостность мелких пузырьков, чётко разделяет соседние пузырьки и избегает «просачивания» в окружающую глазурь даже при размытых краях.

Что это значит для изучения культурного наследия

Для неспециалистов ключевая мысль в том, что эта работа превращает иначе невидимые узоры в керамической глазури в надёжные, измеримые подсказки о прошлом. Точная трассировка микроскопических пузырьков с помощью PBDWNet помогает преобразовать каждый фарфоровый фрагмент в объект, богатый данными, по которым можно более объективно судить о его производстве, происхождении и технологическом уровне. Хотя текущая система всё ещё зависит от тщательно размеченных обучающих данных и может потребовать адаптации к сильно отличающемуся освещению или материалам, она уже демонстрирует, как специализированные инструменты ИИ могут углубить наше понимание культурных артефактов. На практике такие технологии могут поддерживать более точную датировку, исследования происхождения и даже проверки подлинности, укрепляя научную основу археологии и музейной работы.

Цитирование: Xing, J., Zhang, R., Liu, Y. et al. PBDWNet: a multi-scale porcelain surface bubble segmentation network based on frequency-domain fusion and deformable feature awareness. npj Herit. Sci. 14, 260 (2026). https://doi.org/10.1038/s40494-026-02440-8

Ключевые слова: пузырьки в глазури фарфора, визуализация объектов культурного наследия, семантическая сегментация, микроскопический анализ, археологическое происхождение