Clear Sky Science · ru

Восстановление знаков на панелях Лиие эпохи Цинь с помощью генеративно-состязательной сети с ограничением эффективной связной области

2026-03-30 · Назад к списку

Древние слова, возвращённые к жизни

Задолго до появления бумаги китайские чиновники писали на тонких полосках бамбука и дерева. Тысячи этих хрупких записей, известных как дощечки Лиие эпохи Цинь, были извлечены из заброшенного колодца после более чем двух тысячелетий под землёй. Они содержат повседневные распоряжения, учёты и отчёты из первого объединённого китайского государства. Однако вода, ил и микроорганизмы размыли или уничтожили большую часть чернил, из-за чего чтение дощечек вручную идёт крайне медленно. В этом исследовании показано, как современная система искусственного интеллекта может цифрово «очистить» повреждённые знаки, помогая историкам восстановить голоса далёкого прошлого.

Почему эти записи важны

Дощечки Лиие — это не королевские указы и не монументальные надписи; это делопроизводство действующей администрации. Более 30 000 дощечек фиксируют налоги, труд и рутинное управление в одном уезде на границе империи Цинь. В отличие от схожих находок в сухих гробницах, фрагменты из Лиие лежали в влажном осадке на дне колодца. Многие из них деформированы, треснуты и запятнаны; мазки кисти смазаны или уничтожены. Расшифровка одной партии может занять экспертам годы, а количество находок растёт быстрее, чем это под силу человеческим глазам. Автоматизация части процесса восстановления может существенно ускорить исследования, сохраняя при этом тонкие формы, делающие каждый знак читаемым.

Обучение компьютера «видеть» сквозь повреждения

Авторы рассматривают задачу восстановления как разновидность преобразования изображения: на вход подаётся маленькое шумное изображение знака, и требуется получить то, как этот знак выглядел бы чистым и чётким. Для этого они опираются на вид ИИ, называемый генеративно-состязательной сетью (GAN). Одна сеть («генератор») пытается превратить повреждённое изображение в чистое, в то время как другая («дискриминатор») оценивает, выглядит ли результат как подлинный, аккуратно выполненный знак. В ходе этого состязания генератор постепенно учится выдавать всё более правдоподобные восстановления, обманывающие критика.

Более чуткая работа с тонкими мазками

Стандартные методы обработки изображений часто пропускают самые тонкие детали чернил на бамбуке, особенно когда фон пятнистый, а чернила бледны. Команда улучшает ядро GAN, применяя U-образную архитектуру, известную как U-Net, которая сочетает широкий контекст с детальной построчной обработкой пикселей. Они заменяют обычные строительные блоки этой сети специально разработанными локальными плотными остаточными блоками (Local Residual Dense Blocks). Эти блоки помогают системе повторно использовать полезные паттерны и одновременно избегать чрезмерного сглаживания, из-за которого соседние штрихи могут сливаться. Усиленный «бутылочный горлышко» в середине сети дополнительно уточняет наиболее важные признаки, помогая модели отличать истинные штрихи от шума даже при сильном повреждении оригинала.

Сохранение «скелета» каждого знака

Ключевое новшество — так называемое ограничение эффективной связной области (Effective Connected Domain). Вместо оценки каждого пикселя в отдельности это правило смотрит на основные области чернил в знаке: насколько они велики и где находятся их центры. Модель сравнивает эти грубые «острова» чернил в своём выводе с таковыми в тщательно восстановленных эталонных изображениях, уделяя особое внимание лишь нескольким крупнейшим областям, которые образуют основной «скелет» знака. Если крупный штрих отсутствует, слиян с другим или смещён, система получает штраф и вынуждена исправиться. Эта простая геометрическая проверка оказывается удивительно устойчивой даже при разорванных штрихах, рваных краях или растёкании чернил по фону.

Насколько хорошо работают цифровые реставрации

Поскольку подходящих данных не существовало, команда создала собственную парную выборку из 600 изображений знаков с дощечек Лиие, сопоставив каждое с кропотливо выполненной экспертной реставрацией. На этом бенчмарке их метод превосходит несколько современных подходов, включая другие GAN, модель на базе трансформера и модель диффузии, по трем стандартным метрикам качества изображения. Визуальные сравнения «рядом с рядом» показывают меньше разорванных штрихов, более чистое разделение близко расположенных линий кисти и меньше помех на фоне. Преподаватели каллиграфии, оценившие результаты в двойном слепом тесте, высоко отметили непрерывность штрихов, структурную точность и общую читаемость; отдельные тесты также указывают на то, что модель не просто запоминает обучающие данные.

Возвращение к жизни забытых надписей

Для неспециалистов вывод ясен: комбинируя экспертные знания древних графем с настроенными архитектурами ИИ, теперь возможно восстанавливать разборчивое письмо с бамбуковых дощечек, которые когда-то казались слишком повреждёнными для использования. Модель сохраняет не только факт присутствия знака, но и пространственные отношения его штрихов, делая результат ценным для историков и лингвистов. Хотя подход по-прежнему зависит от ограниченных обучающих данных и ещё не адаптирован к другим материалам, таким как шелк или камень, он указывает на будущее, в котором многие хрупкие, трудно читаемые тексты можно цифрово реставрировать и изучать в масштабах, открывая новые окна в повседневную жизнь ранних империй.

Цитирование: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6

Ключевые слова: восстановление бамбуковых дощечек, древние китайские рукописи, генеративно-состязательные сети, сохранение цифрового наследия, восстановление рукописных знаков