Clear Sky Science · ru

Метод восстановления иероглифов JianDu на основе кросс-доменных «дебайсированных» фурье-фьюжнов и параметризованного запроса по координатам

· Назад к списку

Возвращая к жизни выцветшие бамбуковые тексты

Более двух тысяч лет чиновники, солдаты и ученые Китая записывали тексты на тонких полосках бамбука и дерева. Сегодня эти хрупкие «цзяньду» содержат бесценные сведения о политике, торговле и повседневной жизни древнего Китая — но надписи часто стёрты временем, плесенью и повреждениями. В работе представлен новый метод искусственного интеллекта (ИИ), который умеет цифрово восстанавливать отдельные знаки на таких дощечках, помогая историкам читать тексты, которые иначе были бы почти нечитаемы.

Figure 1
Figure 1.

Почему старый бамбук так трудно прочитать

В отличие от современных печатных страниц, поверхность бамбуковых и деревянных дощечек сильно текстурирована: волокна и пятна создают выраженные узоры. Чернильные штрихи, за которые важна смысловая информация, тонкие и едва заметные, тогда как фон рельефный и неправильный. Для компьютера фон может «звучать» громче, чем сама надпись. Пятна плесени равномерно затемняют участки поверхности, а трещины или отсутствующие фрагменты полностью уничтожают части знаков. Стандартные программы восстановления изображений, хорошо работающие с обычными фотографиями, склонны размывать тонкие штрихи, придумывать ложные текстуры или смешивать фоновый шум в тех областях, где должны быть знаки.

Целенаправленный способ воссоздания недостающих штрихов

Многие методы восстановления пытаются заново сгенерировать каждый пиксель изображения, даже в областях, которые сохранены хорошо. Авторы вместо этого спроектировали систему, которая концентрирует усилия на повреждённых зонах и их непосредственном окружении. Сначала сеть «генерации параметров» сканирует уменьшенную по размеру версию повреждённой дощечки вместе с маской, показывающей, где отсутствует информация. Она затем создаёт компактный набор инструкций — по сути рецепт, адаптированный к конкретным дыркам и близкому контексту. Вторая сеть «запроса пикселя» использует этот рецепт вместе с точными координатами каждого пикселя внутри повреждённых областей, чтобы восстанавливать их по одному. Поскольку сеть всегда точно знает, где на изображении она работает, ей легче сохранять тонкие детали, такие как кромки и соединения штрихов, даже на высоком разрешении.

Слияние пространства и волн без искажений

Для понимания и исправления сложных узоров метод опирается не только на формы в плоскости изображения. Он также анализирует, как светлые и тёмные вариации распределены по разным масштабам, используя преобразование Фурье — математический инструмент, представляющий изображение как смесь волн. В изображениях цзяньду низкочастотные волны в основном описывают бамбуковый фон, тогда как высокие частоты фиксируют резкие кромки знаков. Однако наивное применение распространённых приёмов нейронных сетей в этой волновой области может исказить спектр, приводя к странным цветовым блокам и «протеканию» фоновых паттернов в штрихи. Авторы поэтому вводят «дебайсированный» фурье-модуль, который перестраивает и центрирует спектр, маркирует каждую частотную полосу обучаемой позицией и мягко нормализует экстремальные значения. Одновременно блок слияния пространственно-частотных признаков позволяет пространственным (локальным формам и текстурам) и частотным (глобальным узорам и статистике шума) признакам направлять друг друга через механизм кросс-внимания, создавая более богатое и стабильное представление повреждённого изображения.

Figure 2
Figure 2.

Проверка метода на практике

Команда собрала крупный набор данных из более чем 60 000 изображений одиночных знаков с бамбуковых и деревянных дощечек разных китайских династий, аккуратно отфильтровала по качеству и разделила на обучающую и тестовую части. Они также использовали проверенные коллекции искусственных масок повреждений, чтобы имитировать разные типы утрат — мелкие пробелы, большие отсутствующие области и случайные трещиноподобные формы — а также набор уличных фотографий, чтобы оценить, насколько метод обобщается за пределы наследственных материалов. В широком спектре тестов новый подход точнее воссоздавал отсутствующие участки по сравнению с семью ведущими техниками инпейнтинга, показывая лучшие показатели по точности пикселей, воспринимаемой резкости и структурному сходству. Визуальные сравнения демонстрируют более чистые штрихи знаков, меньше мозайковых артефактов и меньше «загрязнения» от фоновых текстур, даже при сильных проявлениях плесени или волокон.

Что это значит для чтения прошлого

В конечном счёте эта работа предлагает специализированного цифрового «реставратора» для древних бамбуковых и деревянных текстов. Обучаясь отделять хрупкие чернильные штрихи от зашумлённых, повреждённых фонов — и тщательно контролируя взаимодействие пространственных форм и волновых паттернов — метод способен заполнить отсутствующие части знаков так, что это выглядит правдоподобно для экспертов-человеков и поддерживает автоматическое распознавание символов. Хотя он всё ещё испытывает трудности с очень большими пропусками и некоторыми сложными стилями письма, подход представляет собой значительный шаг к тому, чтобы слабые, обрывочные следы на древних дощечках превращать в читаемый и пригодный для анализа текст для историков, лингвистов и широкой публики.

Цитирование: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w

Ключевые слова: восстановление бамбуковых дощечек, древнекитайские иероглифы, восстановление изображений (inpainting), глубокое обучение на основе преобразования Фурье, цифровое культурное наследие