Clear Sky Science · ru
Метод восстановления иероглифов JianDu на основе кросс-доменных «дебайсированных» фурье-фьюжнов и параметризованного запроса по координатам
Возвращая к жизни выцветшие бамбуковые тексты
Более двух тысяч лет чиновники, солдаты и ученые Китая записывали тексты на тонких полосках бамбука и дерева. Сегодня эти хрупкие «цзяньду» содержат бесценные сведения о политике, торговле и повседневной жизни древнего Китая — но надписи часто стёрты временем, плесенью и повреждениями. В работе представлен новый метод искусственного интеллекта (ИИ), который умеет цифрово восстанавливать отдельные знаки на таких дощечках, помогая историкам читать тексты, которые иначе были бы почти нечитаемы.

Почему старый бамбук так трудно прочитать
В отличие от современных печатных страниц, поверхность бамбуковых и деревянных дощечек сильно текстурирована: волокна и пятна создают выраженные узоры. Чернильные штрихи, за которые важна смысловая информация, тонкие и едва заметные, тогда как фон рельефный и неправильный. Для компьютера фон может «звучать» громче, чем сама надпись. Пятна плесени равномерно затемняют участки поверхности, а трещины или отсутствующие фрагменты полностью уничтожают части знаков. Стандартные программы восстановления изображений, хорошо работающие с обычными фотографиями, склонны размывать тонкие штрихи, придумывать ложные текстуры или смешивать фоновый шум в тех областях, где должны быть знаки.
Целенаправленный способ воссоздания недостающих штрихов
Многие методы восстановления пытаются заново сгенерировать каждый пиксель изображения, даже в областях, которые сохранены хорошо. Авторы вместо этого спроектировали систему, которая концентрирует усилия на повреждённых зонах и их непосредственном окружении. Сначала сеть «генерации параметров» сканирует уменьшенную по размеру версию повреждённой дощечки вместе с маской, показывающей, где отсутствует информация. Она затем создаёт компактный набор инструкций — по сути рецепт, адаптированный к конкретным дыркам и близкому контексту. Вторая сеть «запроса пикселя» использует этот рецепт вместе с точными координатами каждого пикселя внутри повреждённых областей, чтобы восстанавливать их по одному. Поскольку сеть всегда точно знает, где на изображении она работает, ей легче сохранять тонкие детали, такие как кромки и соединения штрихов, даже на высоком разрешении.
Слияние пространства и волн без искажений
Для понимания и исправления сложных узоров метод опирается не только на формы в плоскости изображения. Он также анализирует, как светлые и тёмные вариации распределены по разным масштабам, используя преобразование Фурье — математический инструмент, представляющий изображение как смесь волн. В изображениях цзяньду низкочастотные волны в основном описывают бамбуковый фон, тогда как высокие частоты фиксируют резкие кромки знаков. Однако наивное применение распространённых приёмов нейронных сетей в этой волновой области может исказить спектр, приводя к странным цветовым блокам и «протеканию» фоновых паттернов в штрихи. Авторы поэтому вводят «дебайсированный» фурье-модуль, который перестраивает и центрирует спектр, маркирует каждую частотную полосу обучаемой позицией и мягко нормализует экстремальные значения. Одновременно блок слияния пространственно-частотных признаков позволяет пространственным (локальным формам и текстурам) и частотным (глобальным узорам и статистике шума) признакам направлять друг друга через механизм кросс-внимания, создавая более богатое и стабильное представление повреждённого изображения.

Проверка метода на практике
Команда собрала крупный набор данных из более чем 60 000 изображений одиночных знаков с бамбуковых и деревянных дощечек разных китайских династий, аккуратно отфильтровала по качеству и разделила на обучающую и тестовую части. Они также использовали проверенные коллекции искусственных масок повреждений, чтобы имитировать разные типы утрат — мелкие пробелы, большие отсутствующие области и случайные трещиноподобные формы — а также набор уличных фотографий, чтобы оценить, насколько метод обобщается за пределы наследственных материалов. В широком спектре тестов новый подход точнее воссоздавал отсутствующие участки по сравнению с семью ведущими техниками инпейнтинга, показывая лучшие показатели по точности пикселей, воспринимаемой резкости и структурному сходству. Визуальные сравнения демонстрируют более чистые штрихи знаков, меньше мозайковых артефактов и меньше «загрязнения» от фоновых текстур, даже при сильных проявлениях плесени или волокон.
Что это значит для чтения прошлого
В конечном счёте эта работа предлагает специализированного цифрового «реставратора» для древних бамбуковых и деревянных текстов. Обучаясь отделять хрупкие чернильные штрихи от зашумлённых, повреждённых фонов — и тщательно контролируя взаимодействие пространственных форм и волновых паттернов — метод способен заполнить отсутствующие части знаков так, что это выглядит правдоподобно для экспертов-человеков и поддерживает автоматическое распознавание символов. Хотя он всё ещё испытывает трудности с очень большими пропусками и некоторыми сложными стилями письма, подход представляет собой значительный шаг к тому, чтобы слабые, обрывочные следы на древних дощечках превращать в читаемый и пригодный для анализа текст для историков, лингвистов и широкой публики.
Цитирование: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w
Ключевые слова: восстановление бамбуковых дощечек, древнекитайские иероглифы, восстановление изображений (inpainting), глубокое обучение на основе преобразования Фурье, цифровое культурное наследие