Clear Sky Science · ru

Семантическая сегментация облаков точек лица Будды с помощью направленного знаниями регионального роста

2026-02-18 · Назад к списку

Чтение лица истории

Статуи Будды, высеченные в утёсах и на стенах храмов, — это не просто красивые произведения искусства, а трёхмерные записи религиозных представлений, художественных вкусов и культурного обмена, сохранившиеся на протяжении веков. В этом исследовании показано, как информатики и специалисты по наследию могут «читать» эти каменные лица в деталях, автоматически отделяя глаза, нос, рот и другие черты на основе плотных 3D-измерений, даже когда нет размеченных примеров для обучения. Цель — превратить молчаливый камень в измеримые данные, которые помогут историкам сравнивать стили, отслеживать изменения во времени и планировать бережную консервацию.

Почему цифровые лица важны

На таких известных памятниках, как Дуньхуан, Юнган и Лунмэнь, лица Будды отличаются тонкими чертами по династиям и регионам — одни более полные, другие более стройные, с мягче очерченными глазами или более выступающими носами. Традиционно искусствоведы описывали эти различия визуально; теперь высокоточные 3D-сканы фиксируют поверхность статуй как миллионы точек в пространстве. Однако эти «облака точек» беспорядочны: в них нет цвета или текстуры, и они не сообщают, где заканчиваются глаза и начинаются щеки. Существующие автоматические методы либо требуют множества вручную размеченных примеров, которые просто отсутствуют для памятников наследия, либо разрезают поверхность только по геометрии, игнорируя скульптурные правила, которым следовали мастера.

Обучение алгоритмов правилам лица

Вместо попыток учиться на скудных данных авторы исходят из знаний, которыми пользовались сами скульпторы. Традиционные буддийские руководства описывают стандартные пропорции лица — например, деление лица на равные трети для лба, носа и подбородка, а также сохранение симметрии относительно центральной оси. Исследователи переводят эти культурные и анатомические представления в простые геометрические правила: плоскость симметрии посередине; вертикальная линия, проходящая через центр носа; и соотношения, связывающие положения и размеры глаз, носа, рта, ушей и подбородка. Эти правила не являются жесткими шаблонами: они содержат настраиваемые параметры, чтобы как более полные лица в стиле Тан, так и более стройные лица в стиле Сун укладывались в гибкую, но узнаваемую схему.

Рост регионов от семян

Работая с очищенным 3D-сканом, метод сначала выравнивает лицо Будды так, чтобы оно было направлено прямо, затем проецирует поверхность на квадратную сетку, превращая 3D-форму во что-то вроде затенённой карты высот. В пределах этой сетки алгоритм выбирает стартовые «семена» для каждой черты лица, руководствуясь заранее заданными правилами: семя носа находится рядом с центральной вертикальной линией и локальной высокой точкой, глаза располагаются на симметричных вершинах по обе стороны, рот лежит под носом в неглубокой впадине и т.д. От каждого семени компьютер «растит» регион наружу, добавляя соседние ячейки только тогда, когда их высота и наклон соответствуют ожидаемому для, скажем, гребня носа, а не щеки. Дополнительные этапы затем очищают результат: отсекают случайные фрагменты, заполняют небольшие пробелы и аккуратно сглаживают контуры, так что сегментированные глаза, губы и подбородок выглядят непрерывными и правдоподобными как для компьютера, так и для человеческого эксперта.

Проверка метода

Команда испытала подход на пятнадцати лицах Будды — девяти синтетических моделях с контролируемыми формами и шести реальных сканах с известных китайских объектов наследия. Качество оценивали по степени совпадения автоматически сегментированных областей с тщательно отрисованными вручную контурами специалистов и по тому, насколько близко вычисленные границы совпадали с контурами экспертов. По таким элементам, как глаза, брови, уши, нос, рот и подбородок, метод показал высокие показатели, что означает, что большая часть точек была правильно отнесена к нужной черте. Что важно, результаты оставались устойчивыми при разных стилях резьбы и уровнях износа поверхности. Когда авторы сравнили свой подход с популярной моделью глубокого обучения, обученной всего на нескольких размеченных примерах, сеть, требующая больших данных, показала слабые результаты, в то время как подход, основанный на знаниях, остался точным без больших обучающих наборов.

Что это значит для наследия

Кодируя традиционные измерительные правила скульпторов в современный алгоритм, это исследование демонстрирует, что компьютеры могут сегментировать лица Будды в 3D с минимальной или нулевой ручной разметкой, при этом уважая культурную логику оригинального произведения. Для историков это открывает путь к систематическим количественным сравнениям лицевых стилей между памятниками и эпохами; для реставраторов это даёт точный инструмент для мониторинга повреждений или руководства при цифровой реставрации. По сути, метод превращает многовековые каноны идеального лица Будды в практический инструмент для чтения, сохранения и понимания каменных лиц, которые охраняют храмы и пещеры более тысячи лет.

Цитирование: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Ключевые слова: 3D-сканирование статуй Будды, оцифровка культурного наследия, сегментация облаков точек, пропорции лица в искусстве, алгоритмы, основанные на знаниях