Clear Sky Science · ru

Диффузионная модель с многоуровневой инъекцией и селективным вниманием для восстановления изображений наскальной живописи Хуашань

· Назад к списку

Возвращая к жизни древние скальные росписи

Наскальная живопись Чжоуцзян Хуашань на юге Китая представляет собой обширную галерею на утёсе, созданную более двух тысяч лет назад. Сегодня многие из этих охристых фигур и символов сильно выцвели, потрескались или вовсе утрачены. В статье предложен цифровой метод, использующий современные техники генерации изображений для виртуального восстановления этих хрупких произведений, с целью поддержки аккуратной консервации, исследований и публичного восприятия без физического вмешательства в скалу.

Figure 1
Figure 1.

Почему эти настенные росписи важны

Наскальная живопись Хуашань тянется вдоль крутых речных скал и изображает сидящих фигур людей, ритуальные сцены и другие символические формы в насыщенных красных тонах. Это один из крупнейших и богатейших комплексов наскальной живописи на юге Китая и в Юго-Восточной Азии и ключевая часть культуры чжуан. Пигменты, приготовленные из железосодержащих минералов, легко разрушаются под воздействием дождя, ветра, биологического роста и контакта с человеком. За века это привело к выцветанию, разрушению контуров, отслаиванию участков и шумным, выветренным текстурам, которые бывает трудно отличить от собственно изображённого мотива. Традиционное ручное восстановление медленное, субъективное и плохо воспроизводимо, что затрудняет защиту такого обширного и уязвимого памятника в масштабе.

Как интеллектуальное восстановление может помочь

Цифровое восстановление изображений даёт возможность «заполнять пробелы» виртуально, следуя принципу минимального вмешательства в консервации. Вместо того чтобы заново расписывать скалу, компьютеры выводят вероятные формы и текстуры в утраченных областях, создавая согласованные, обратимые результаты, которые можно хранить в архивных высоких разрешениях, использовать для исследований и демонстрировать публике через экспозиции и иммерсивные форматы. Предыдущие работы по ИИ в области культурного наследия в основном фокусировались на обнаружении повреждений или сегментации мотивов либо на восстановлении фресок, где формы и текстуры более регулярны. Наскальная живопись представляет более сложную задачу: её смысл заключён в тонких контурах и символических позах, а поверхности сильно выветрены и неровны. Метод восстановления должен уважать оригинальные формы и при этом правдоподобно дополнять грубые, разрушенные текстуры, не выдумывая лишнего.

Новый набор данных для выветрившихся скальных поверхностей

Авторы сначала собрали специализированный набор изображений для восстановления наскальной живописи Хуашань. Они набрали 528 кандидатов из печатных атласов и общедоступных онлайн-источников, затем тщательно отобрали 177 изображений, которые ясно показывали мотивы наскальной живописи вместе с видимой деградацией — выцветанием, отслаиванием и размытыми границами. Все выбранные изображения приведены к единому цветовому формату и изменены до 512×512 пикселей с центровкой основной раскрашенной области. Чтобы обучать и тестировать методы восстановления в контролируемых условиях, для каждого образца сгенерированы три варианта: (1) эталонное чистое изображение, (2) входное изображение, в котором 30–65% площади замаскировано чёрными пятнами для имитации повреждений, и (3) маска, указывающая отсутствующие области. Такая схема позволяет проводить объективную поксельную оценку того, насколько хорошо различные методы восстанавливают исходное произведение.

Figure 2
Figure 2.

Обучение модели уважать форму и поверхность

Ядро статьи — рамочная система восстановления, построенная на диффузионных моделях, современной группе генеративных методов, которые постепенно превращают шум в изображение через множество небольших шагов денойзинга. Вместо того чтобы рассматривать все визуальные подсказки как единое целое, авторы разделяют руководство на два отдельных «приора»: один подчёркивает структуру (края и контуроподобные штрихи), второй — текстуру (мелкую зернистость и шероховатость поверхности). Эти приоры вычисляются по сохранившимся частям повреждённого изображения с помощью детерминистских фильтров и затем кодируются в карты признаков. Модуль с «взвешенным» вниманием решает на каждом шаге денойзинга, насколько доверять структурному или текстурному указанию и с какой силой внедрять их в диффузионный процесс. На ранних этапах система опирается больше на устойчивые контуры; позже, по мере уменьшения шума, уделяется больше внимания восстановлению текстурных деталей, согласующихся с окружающей поверхностью скалы.

Насколько хорошо работает цифровой реставратор

Команда обучает и тестирует метод на наборе данных Хуашань, сравнивая его с широким кругом существующих моделей восстановления изображений — от классических энкодер–декодер сетей до современных генеративных и пространственно-временных подходов. По стандартным метрикам ошибки, резкости и структурного сходства их модель достигает меньших поксельных ошибок и более высокого структурного соответствия по сравнению со всеми базовыми методами на тестовом наборе по наскальной живописи. Абляционные исследования показывают, что каждый добавленный компонент — двухветвевое извлечение приоров и модуль взвешенного внимания — даёт заметные улучшения. Визуальные сравнения демонстрируют более плавное продолжение человеческих и символических контуров и более естественную интеграцию восстановленных областей с выветренным фоном. Карты внимания дополнительно указывают, что модель фокусируется на отсутствующих границах, ключевых контурах символов и зонах перехода текстуры, а не на слепом перерисовывании больших участков.

Что это значит для сохранения прошлого

Для неспециалистов главный вывод таков: метод предлагает более осторожный и интерпретируемый способ цифрового восстановления древних скальных росписей. Разделяя подсказки формы и поверхности и меняя их влияние во времени, модель может воссоединять разорванные фигуры и заполнять утраченные фрагменты, сохраняя при этом внешний вид и материальное ощущение оригинальной скалы. Авторы подчёркивают, что их система — вспомогательный инструмент, а не замена экспертному суждению, и что требуется больше разнообразных данных и экспертной оценки. Тем не менее работа указывает на будущее, в котором находящуюся под угрозой наскальную живопись можно документировать, изучать и показывать в цифрово восстановленном виде, сохраняя и визуальное воздействие, и культурное значение без физического вмешательства.

Цитирование: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

Ключевые слова: восстановление наскальной живописи, культурное наследие, диффузионные модели, дополнение изображений, картины Хуашань