Clear Sky Science · ru

Восстановление знаков на панелях Лиие эпохи Цинь с помощью генеративно-состязательной сети с ограничением эффективной связной области

· Назад к списку

Древние слова, возвращённые к жизни

Задолго до появления бумаги китайские чиновники писали на тонких полосках бамбука и дерева. Тысячи этих хрупких записей, известных как дощечки Лиие эпохи Цинь, были извлечены из заброшенного колодца после более чем двух тысячелетий под землёй. Они содержат повседневные распоряжения, учёты и отчёты из первого объединённого китайского государства. Однако вода, ил и микроорганизмы размыли или уничтожили большую часть чернил, из-за чего чтение дощечек вручную идёт крайне медленно. В этом исследовании показано, как современная система искусственного интеллекта может цифрово «очистить» повреждённые знаки, помогая историкам восстановить голоса далёкого прошлого.

Почему эти записи важны

Дощечки Лиие — это не королевские указы и не монументальные надписи; это делопроизводство действующей администрации. Более 30 000 дощечек фиксируют налоги, труд и рутинное управление в одном уезде на границе империи Цинь. В отличие от схожих находок в сухих гробницах, фрагменты из Лиие лежали в влажном осадке на дне колодца. Многие из них деформированы, треснуты и запятнаны; мазки кисти смазаны или уничтожены. Расшифровка одной партии может занять экспертам годы, а количество находок растёт быстрее, чем это под силу человеческим глазам. Автоматизация части процесса восстановления может существенно ускорить исследования, сохраняя при этом тонкие формы, делающие каждый знак читаемым.

Figure 1
Figure 1.

Обучение компьютера «видеть» сквозь повреждения

Авторы рассматривают задачу восстановления как разновидность преобразования изображения: на вход подаётся маленькое шумное изображение знака, и требуется получить то, как этот знак выглядел бы чистым и чётким. Для этого они опираются на вид ИИ, называемый генеративно-состязательной сетью (GAN). Одна сеть («генератор») пытается превратить повреждённое изображение в чистое, в то время как другая («дискриминатор») оценивает, выглядит ли результат как подлинный, аккуратно выполненный знак. В ходе этого состязания генератор постепенно учится выдавать всё более правдоподобные восстановления, обманывающие критика.

Более чуткая работа с тонкими мазками

Стандартные методы обработки изображений часто пропускают самые тонкие детали чернил на бамбуке, особенно когда фон пятнистый, а чернила бледны. Команда улучшает ядро GAN, применяя U-образную архитектуру, известную как U-Net, которая сочетает широкий контекст с детальной построчной обработкой пикселей. Они заменяют обычные строительные блоки этой сети специально разработанными локальными плотными остаточными блоками (Local Residual Dense Blocks). Эти блоки помогают системе повторно использовать полезные паттерны и одновременно избегать чрезмерного сглаживания, из-за которого соседние штрихи могут сливаться. Усиленный «бутылочный горлышко» в середине сети дополнительно уточняет наиболее важные признаки, помогая модели отличать истинные штрихи от шума даже при сильном повреждении оригинала.

Сохранение «скелета» каждого знака

Ключевое новшество — так называемое ограничение эффективной связной области (Effective Connected Domain). Вместо оценки каждого пикселя в отдельности это правило смотрит на основные области чернил в знаке: насколько они велики и где находятся их центры. Модель сравнивает эти грубые «острова» чернил в своём выводе с таковыми в тщательно восстановленных эталонных изображениях, уделяя особое внимание лишь нескольким крупнейшим областям, которые образуют основной «скелет» знака. Если крупный штрих отсутствует, слиян с другим или смещён, система получает штраф и вынуждена исправиться. Эта простая геометрическая проверка оказывается удивительно устойчивой даже при разорванных штрихах, рваных краях или растёкании чернил по фону.

Figure 2
Figure 2.

Насколько хорошо работают цифровые реставрации

Поскольку подходящих данных не существовало, команда создала собственную парную выборку из 600 изображений знаков с дощечек Лиие, сопоставив каждое с кропотливо выполненной экспертной реставрацией. На этом бенчмарке их метод превосходит несколько современных подходов, включая другие GAN, модель на базе трансформера и модель диффузии, по трем стандартным метрикам качества изображения. Визуальные сравнения «рядом с рядом» показывают меньше разорванных штрихов, более чистое разделение близко расположенных линий кисти и меньше помех на фоне. Преподаватели каллиграфии, оценившие результаты в двойном слепом тесте, высоко отметили непрерывность штрихов, структурную точность и общую читаемость; отдельные тесты также указывают на то, что модель не просто запоминает обучающие данные.

Возвращение к жизни забытых надписей

Для неспециалистов вывод ясен: комбинируя экспертные знания древних графем с настроенными архитектурами ИИ, теперь возможно восстанавливать разборчивое письмо с бамбуковых дощечек, которые когда-то казались слишком повреждёнными для использования. Модель сохраняет не только факт присутствия знака, но и пространственные отношения его штрихов, делая результат ценным для историков и лингвистов. Хотя подход по-прежнему зависит от ограниченных обучающих данных и ещё не адаптирован к другим материалам, таким как шелк или камень, он указывает на будущее, в котором многие хрупкие, трудно читаемые тексты можно цифрово реставрировать и изучать в масштабах, открывая новые окна в повседневную жизнь ранних империй.

Цитирование: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6

Ключевые слова: восстановление бамбуковых дощечек, древние китайские рукописи, генеративно-состязательные сети, сохранение цифрового наследия, восстановление рукописных знаков