Clear Sky Science · ru

Исследование распознавания узоров на медных зеркалах Сунской эпохи на основе MOEAD

· Назад к списку

Почему древние зеркала встречаются с современными машинами

Представьте, что камера вашего телефона мгновенно определяет, какие мифические существа вычеканены на тысячелетнем бронзовом зеркале. Это исследование приближает такую возможность к реальности. Авторы объединяют современные алгоритмы распознавания изображений с интеллектуальной стратегией оптимизации, чтобы автоматически идентифицировать зооморфные орнаменты на зеркалах Сунской династии, помогая кураторам, археологам и широкой публике быстрее и точнее изучать культурные сокровища.

Figure 1
Figure 1.

Освещая бронзовые зеркала эпохи Сун

Бронзовые зеркала были предметами повседневного обихода в древнем Китае, но они также несли глубокий социальный и духовный смысл. К эпохе Сун их тыльные стороны украшали замысловатые сцены: драконы и фениксы, журавли и черепахи, львы и олени — каждый мотив был наполнен символикой власти, удачи и верований. Было раскопано большое количество таких зеркал, однако определение их детальных узоров долгое время зависело от экспертов — подхода медленного, субъективного и трудного для масштабирования. Авторы утверждают, что если компьютеры смогут надёжно распознавать эти мотивы, это обеспечит более последовательное каталогизирование, цифровое сохранение и новые виды культурного анализа.

Преобразование мотивов в данные, доступные компьютеру

Чтобы научить компьютер «видеть» эти орнаменты, команда сначала собрала специализированную коллекцию изображений из 140 бронзовых зеркал Сунской эпохи, включающую 14 типов животных — от драконов и фениксов до рыб, тигров и мандаринок. Каждое изображение было тщательно размечено по мотиву и затем разделено на обучающую, валидационную и тестовую выборки. Поскольку набор данных невелик и некоторые животные встречаются редко, исследователи расширили обучающий материал с помощью системных трансформаций — обрезки, зеркального отражения, поворотов, изменения цвета и яркости, а также стирания небольших участков. Эти вариации имитируют, как реальные артефакты могут выглядеть при разном освещении, углах съёмки или износе, помогая модели усваивать суть каждого мотива вместо запоминания нескольких идеальных примеров.

Как работает умная система распознавания

В основе системы лежит модель глубокого обучения ResNet50 — своего рода цифровой глаз, который учится извлекать визуальные шаблоны из изображений. В её архитектуре есть «шорткаты» (пропуски), помогающие информации проходить через множество слоёв без затухания, что позволяет захватывать как тонкие поверхностные детали, так и более крупные формы. Поверх этого авторы вводят стратегию из эволюционных вычислений, известную как MOEA/D. Вместо ручного подбора параметров обучения они позволяют виртуальной популяции кандидатов «эволюционировать» в течение множества раундов. Каждый кандидат оценивается по нескольким целям одновременно: минимизация ошибок предсказания, максимизация точности по меткам и поддержание стабильного поведения. Со временем алгоритм сходится к комбинациям скорости обучения и силы регуляризации, дающим оптимальный компромисс между точностью и надёжностью.

Figure 2
Figure 2.

Проверка системы в деле

Исследователи затем сравнили их оптимизированную модель с тремя популярными альтернативами: VGG16, EfficientNet-B0 и не оптимизированной версией ResNet50. Все модели обучались на одних и тех же изображениях зеркал и тестировались на невидимых примерах. Оптимизированная система выделилась: она достигла Hamming-точности — показателя согласованности предсказаний по меткам — более 94% на валидационной выборке и свыше 91% на тестовой, опередив другие сети. Также она показывала более ровную производительность по категориям, избегая ситуации, когда некоторые животные распознаются почти идеально, а другие полностью пропускаются. Дополнительные эксперименты, включая статистические тесты и исследования с сокрытием частей изображения, показали, что улучшения не случайны: модель действительно фокусируется на областях с мотивами и делает это повторяемо, даже для некоторых редких животных.

Что это значит для сохранения культурного наследия

Для неспециалистов вывод прост: исследование демонстрирует, что тщательно настроенный искусственный интеллект способен надёжно распознавать животных на вековых бронзовых зеркалах с минимальными дополнительными вычислительными затратами и меньшей зависимостью только от экспертной оценки. Хотя модель всё ещё испытывает трудности с очень редкими или визуально похожими мотивами, она уже предоставляет практический инструмент для музеев и исследователей, ускоряющий каталогизацию и поддерживающий цифровые архивы. По мере появления больших коллекций изображений и доработки метода — возможно, с более мощной генерацией данных и объяснимыми визуализациями — аналогичные подходы можно будет распространить на другие артефакты, от резного камня до расписных тканей, делая невидимую структуру нашего материального прошлого вновь видимой для учёных и широкой публики.

Цитирование: Feng, Q., Yu, K., Li, Y. et al. Research on Song dynasty copper mirror pattern recognition based on MOEAD. npj Herit. Sci. 14, 158 (2026). https://doi.org/10.1038/s40494-026-02413-x

Ключевые слова: бронзовые зеркала династии Сун, ИИ для культурного наследия, распознавание образов на изображениях, оптимизация глубинного обучения, классификация орнаментов артефактов