Clear Sky Science · ru

Идентификация писца на поэтической керамике Чанша династии Тан с помощью двухканальной многошкальной модуля глобального внимания

· Назад к списку

Стихи на глине, истории о людях

На поверхности небольших фарфоровых сосудов и подушек эпохи Тан более тысячи лет назад кистью были нанесены изящные строчки поэзии поверх сырой глазури. Эти краткие стихотворения сегодня ценят не только за их красоту, но и за то, что они могут рассказать о людях, которые их писали. До сих пор установление связи между конкретной надписью и конкретным писцом зависело от взгляда немногих специалистов. В этом исследовании показано, как современный искусственный интеллект может помочь «прочитать» человеческую руку за этими хрупкими артефактами, открывая новое окно в повседневную жизнь, труд и торговлю в раннем средневековом Китае.

Figure 1
Figure 1.

Почему эти сосуды важны

Гончарная мастерская Чанша, работавшая в расцвет династии Тан, производила цветную керамику, украшенную живописью, каллиграфией и поэзией. Эти предметы путешествовали по ранним торговым путям и становились носителями литературы и вкуса, а также утилитарной посудой. Их надписи сохраняют не только текст, но и энергию мазков кисти и индивидуальные приемы письма. Однако большинство дошедших до нас предметов разбросано по музеям и частным коллекциям, а качественных изображений мало. Публичного стандартизированного набора изображений таких надписей не существовало, что затрудняло сравнение экспонатов, проверку цифровых методов или решение базовых вопросов, например: написал ли один ремесленник-писец стихи на нескольких сосудах?

Создание цифровой библиотеки почерка Тан

Для решения этой задачи авторы сначала собрали новую коллекцию изображений из опубликованных каталогов керамики Чанша. Из 135 отдельных артефактов — в основном кувшинов, тарелок и подушек с поэзией или краткими пометками — они аккуратно выделили 1 865 изображений отдельных иероглифов. Поскольку надписи расположены на изогнутых поверхностях сосудов, символы у краев фотографий кажутся искаженными. Команда применила специализированную сегментацию изображений и процедуру выравнивания поверхности, чтобы исправить эту кривизну, затем очистила изображения от загрязнений и трещин, перевела их в оттенки серого, изменила размер, уменьшила шум и частично зеркально отразила некоторые изображения для увеличения разнообразия. В результате был создан первый специализированный набор данных по поэтической каллиграфии Чанша, ресурс, который может поддержать распознавание письменности, анализ стиля и многие другие исследования в будущем.

Обучение нейросети видеть стиль

Имея этот набор данных, исследователи разработали систему компьютерного зрения, задача которой — решить, были ли два изображения символов, вероятно, написаны одним и тем же человеком. Модель принимает пару символов через два параллельных канала, использующих одинаковые этапы обработки. После базовой фильтрации оба изображения проходят через глубокую нейронную сеть (ResNet-34), которая извлекает паттерны в толщине штрихов, изгибах, интервалах и других тонких признаках. В основе системы лежит новый многошкальный модуль глобального внимания. Вместо того чтобы смотреть только на один фиксированный уровень детализации, этот модуль одновременно исследует символы на нескольких масштабах — от грубой компоновки до тонких колебаний штриха — и учится учитывать, как удаленные участки штриха соотносятся друг с другом. Комбинируя эти представления, модель формирует богатый внутренний «отпечаток» стиля каждого писца и затем сравнивает два таких отпечатка, выдавая оценку схожести от 0 до 1.

Figure 2
Figure 2.

Испытание системы

Команда сравнила несколько популярных архитектур нейросетей и механизмов внимания и обнаружила, что их двухканальная сеть с новым модулем внимания проявляет наилучшую эффективность. Она достигла точности распознавания примерно 97,9%, явно превзойдя старые модели с одношкальным вниманием. Чтобы понять, чему научился алгоритм, авторы сгенерировали тепловые карты, показывающие, куда сеть «смотрит» особенно внимательно. Они подсвечивали повороты штрихов, наклонные левые штрихи и другие области, где сила и ритм кисти отличаются у разных людей — подобно тому, что изучал бы человеческий ценитель. Исследователи затем провели крупномасштабные тесты внутри отдельных артефактов и между разными артефактами. В пределах одного сосуда система последовательно оценила все символы как высоко схожие, что поддерживает идею о том, что стих на каждом сосуде был написан одним писцом, а не несколькими.

Новые улики о древних ремесленниках

Наиболее примечательный результат получили, когда модель сравнила предметы из разных коллекций. Две керамические подушки с любовными семизвучными стихами показали очень высокую стилистическую схожесть, несмотря на то, что сейчас они хранятся в разных учреждениях. Археологические записи связывают обе подушки с одной и той же производственной площадкой, а их формы, декоративные мотивы и тематика тесно совпадают. Вердикт алгоритма — 85,8% вероятность того, что обе надписи выполнены одной рукой — подтверждает вывод о том, что их создал один и тот же писец. Напротив, три похожих кувшина для вина с близкими предостерегающими стихами о сожалении продемонстрировали низкие оценки схожести, что указывает на трех разных каллиграфов, копировавших общий текстовый шаблон. В совокупности эти результаты показывают, как «взгляд» ИИ может помочь историкам прослеживать организацию мастерских, разделение труда и торговые практики.

Что это значит для прошлого и будущего

Сочетая тщательную цифровую съемку с продвинутой нейросетью, это исследование превращает хрупкие следы чернил на керамике в количественные доказательства того, кто что написал. Для широкого читателя главный вывод таков: компьютерное зрение теперь способно различать индивидуальные почерки в древней каллиграфии почти так же надежно, как человеческий эксперт, но значительно быстрее и по гораздо большему количеству объектов. Это делает возможным связывать разбросанные по миру предметы, отслеживать карьеру давно забытых ремесленников и лучше понимать, как массовое производство и личное самовыражение сосуществовали в династии Тан. Хотя метод не совершенен и зависит от ограниченных, порой поврежденных данных, он предлагает мощный новый инструмент для музеев и ученых — и модель для применения ИИ к многим другим видам исторического почерка.

Цитирование: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5

Ключевые слова: древнее почерковедение, керамика династии Тан, идентификация писца, глубокое обучение, цифровое наследие