Clear Sky Science · ru

Семантическая сегментация облаков точек лица Будды с помощью направленного знаниями регионального роста

· Назад к списку

Чтение лица истории

Статуи Будды, высеченные в утёсах и на стенах храмов, — это не просто красивые произведения искусства, а трёхмерные записи религиозных представлений, художественных вкусов и культурного обмена, сохранившиеся на протяжении веков. В этом исследовании показано, как информатики и специалисты по наследию могут «читать» эти каменные лица в деталях, автоматически отделяя глаза, нос, рот и другие черты на основе плотных 3D-измерений, даже когда нет размеченных примеров для обучения. Цель — превратить молчаливый камень в измеримые данные, которые помогут историкам сравнивать стили, отслеживать изменения во времени и планировать бережную консервацию.

Почему цифровые лица важны

На таких известных памятниках, как Дуньхуан, Юнган и Лунмэнь, лица Будды отличаются тонкими чертами по династиям и регионам — одни более полные, другие более стройные, с мягче очерченными глазами или более выступающими носами. Традиционно искусствоведы описывали эти различия визуально; теперь высокоточные 3D-сканы фиксируют поверхность статуй как миллионы точек в пространстве. Однако эти «облака точек» беспорядочны: в них нет цвета или текстуры, и они не сообщают, где заканчиваются глаза и начинаются щеки. Существующие автоматические методы либо требуют множества вручную размеченных примеров, которые просто отсутствуют для памятников наследия, либо разрезают поверхность только по геометрии, игнорируя скульптурные правила, которым следовали мастера.

Figure 1
Figure 1.

Обучение алгоритмов правилам лица

Вместо попыток учиться на скудных данных авторы исходят из знаний, которыми пользовались сами скульпторы. Традиционные буддийские руководства описывают стандартные пропорции лица — например, деление лица на равные трети для лба, носа и подбородка, а также сохранение симметрии относительно центральной оси. Исследователи переводят эти культурные и анатомические представления в простые геометрические правила: плоскость симметрии посередине; вертикальная линия, проходящая через центр носа; и соотношения, связывающие положения и размеры глаз, носа, рта, ушей и подбородка. Эти правила не являются жесткими шаблонами: они содержат настраиваемые параметры, чтобы как более полные лица в стиле Тан, так и более стройные лица в стиле Сун укладывались в гибкую, но узнаваемую схему.

Рост регионов от семян

Работая с очищенным 3D-сканом, метод сначала выравнивает лицо Будды так, чтобы оно было направлено прямо, затем проецирует поверхность на квадратную сетку, превращая 3D-форму во что-то вроде затенённой карты высот. В пределах этой сетки алгоритм выбирает стартовые «семена» для каждой черты лица, руководствуясь заранее заданными правилами: семя носа находится рядом с центральной вертикальной линией и локальной высокой точкой, глаза располагаются на симметричных вершинах по обе стороны, рот лежит под носом в неглубокой впадине и т.д. От каждого семени компьютер «растит» регион наружу, добавляя соседние ячейки только тогда, когда их высота и наклон соответствуют ожидаемому для, скажем, гребня носа, а не щеки. Дополнительные этапы затем очищают результат: отсекают случайные фрагменты, заполняют небольшие пробелы и аккуратно сглаживают контуры, так что сегментированные глаза, губы и подбородок выглядят непрерывными и правдоподобными как для компьютера, так и для человеческого эксперта.

Проверка метода

Команда испытала подход на пятнадцати лицах Будды — девяти синтетических моделях с контролируемыми формами и шести реальных сканах с известных китайских объектов наследия. Качество оценивали по степени совпадения автоматически сегментированных областей с тщательно отрисованными вручную контурами специалистов и по тому, насколько близко вычисленные границы совпадали с контурами экспертов. По таким элементам, как глаза, брови, уши, нос, рот и подбородок, метод показал высокие показатели, что означает, что большая часть точек была правильно отнесена к нужной черте. Что важно, результаты оставались устойчивыми при разных стилях резьбы и уровнях износа поверхности. Когда авторы сравнили свой подход с популярной моделью глубокого обучения, обученной всего на нескольких размеченных примерах, сеть, требующая больших данных, показала слабые результаты, в то время как подход, основанный на знаниях, остался точным без больших обучающих наборов.

Figure 2
Figure 2.

Что это значит для наследия

Кодируя традиционные измерительные правила скульпторов в современный алгоритм, это исследование демонстрирует, что компьютеры могут сегментировать лица Будды в 3D с минимальной или нулевой ручной разметкой, при этом уважая культурную логику оригинального произведения. Для историков это открывает путь к систематическим количественным сравнениям лицевых стилей между памятниками и эпохами; для реставраторов это даёт точный инструмент для мониторинга повреждений или руководства при цифровой реставрации. По сути, метод превращает многовековые каноны идеального лица Будды в практический инструмент для чтения, сохранения и понимания каменных лиц, которые охраняют храмы и пещеры более тысячи лет.

Цитирование: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Ключевые слова: 3D-сканирование статуй Будды, оцифровка культурного наследия, сегментация облаков точек, пропорции лица в искусстве, алгоритмы, основанные на знаниях