Clear Sky Science · ru

Человеко‑компьютерный подход к расшифровке надписей на оросеках с использованием состязательных генеративных сетей

2026-04-10 · Назад к списку

Древнее письмо встречается с современными машинами

Более трёх тысяч лет назад гадатели в Китае вырезали на панцирях черепах и костях животных вопросы о войне, погоде и урожае. Сегодня эти надписи на оракульных костях представляют собой сокровищницу для понимания того, как сформировались китайская письменность и раннее китайское общество. Однако многие из этих крошечных, выветренных символов остаются нерасшифрованными и их слишком много, чтобы несколько экспертов могли справиться в одиночку. В этой статье показано, как искусственный интеллект в сотрудничестве с учёными может помочь прочитать эти древние царапины, преобразуя их в современные формы китайских иероглифов.

От рисунков на кости к изображениям для компьютера

Письмо на оракульных костях необычно образно. Ранние писцы вырезали упрощённые изображения тигров, солнца, людей и орудий прямо в кости, так что каждый знак почти как миниатюрный рисунок. Авторы используют это, рассматривая каждый знак как изображение, а не как строку кода или текст. Они собирают более тысячи пар изображений: с одной стороны — сфотографированный знак на кости, с другой — его известный современный китайский эквивалент. Изменяя размер и очищая эти изображения, они создают стандартизированную библиотеку картинок, на которой компьютер может учиться, превращая вечную задачу расшифровки в современную задачу преобразования изображения в изображение.

Два цифровых художника: взаимодополняющие модели ИИ

Команда обучает два родственных, но разных типа состязательных генеративных сетей (GAN) — моделей ИИ, которые учатся создавать правдоподобные изображения, противопоставляя «генератор» «критику». Одна модель, основанная на системе Pix2Pix, учится на парных примерах: она видит знак на кости и точный современный знак, в который тот должен превратиться. Эта модель особенно хорошо даёт чёткие, аккуратно сформированные современные глифы, которые близко соответствуют ожидаемым формам. Вторая модель, основанная на CycleGAN, разработана для работы даже когда примеры не идеально соответствуют друг другу. Она склонна сохранять исходный скелет и стиль оракульного письма, мягко приводя его к современным формам. Вместе две модели предлагают разные «варианты» того, как старый, повреждённый знак мог бы выглядеть в более регулярном и читаемом виде.

Тестирование машин и сравнение альтернатив

Чтобы проверить, делают ли эти системы нечто большее, чем просто рисуют красивые картинки, авторы проводят тщательный набор тестов. Они отбирают 160 известных пар «оракул — современный», которые ИИ не видел при обучении, и просят каждую модель предсказать современные символы по изображениям с костей. Они сравнивают результаты с истинными ответами с помощью стандартных метрик качества изображения и структуры, а также инспектируют результаты визуально. В более широком сравнении они сопоставляют свои две GAN с другими популярными методами обработки изображений, включая диффузионные модели, трансформеры и классические сети в стиле U‑Net. Пара GAN выделяется: Pix2Pix даёт наиболее чёткие и разборчивые символы, тогда как CycleGAN обеспечивает консервативные, сохраняющие структуру альтернативы. Другие методы часто размывают штрихи, разрушают «скелет» знака или генерируют формы, которые уже не похожи на письмо, что делает их плохим инструментом для серьёзной расшифровки.

Человек в цикле: сотрудничество, а не замена

Суть исследования — не только ИИ, а структурированное партнёрство между машинами и экспертами. Для 150 надписей, значения которых ранее были неизвестны, модели генерируют несколько кандидатов на современные глифы. Человеческие специалисты затем отбирают перспективные варианты и вручную дорисовывают отсутствующие или неуверенные штрихи, руководствуясь как предложениями ИИ, так и своими знаниями истории языка и житейских сцен, отражённых в текстах. В подробных тематических исследованиях — например, при выдвижении гипотезы, что один неизвестный знак означает «пещера» или «логово» — авторы объединяют формы, предложенные ИИ, сравнения с родственными знаками и историческую информацию о древнем жилье и ритуалах. Они также проводят контролируемые эксперименты на 160 известных случаях, сравнивая три режима: только ИИ, люди рисуют с нуля и люди дорабатывают наброски ИИ. Сочетанный подход последовательно даёт изображения, ближе соответствующие истинным символам по числовым метрикам и по оценкам экспертных комиссий, при этом экономя время и усилия учёных.

Почему это важно для истории и наследия

Для неспециалистов выгода очевидна: каждый вновь расшифрованный знак на оракульной кости уточняет наше представление о ранней китайской истории — от царских жертвоприношений до земледелия и болезней. Эта работа показывает, что ИИ может делать больше, чем распознавать современный почерк или генерировать изображения; при сочетании с тщательным человеческим суждением он может помочь открыть древнейшие слои письменной культуры. Система не заменяет экспертов, а выступает как умный помощник, предлагающий формы, ускоряющий утомительную перерисовку и делая весь процесс более прозрачным и измеримым. Авторы утверждают, что такое партнёрство человека и компьютера может распространиться на другие древние письма и повреждённые документы, превращая хрупкие следы на кости, глине или пергаменте в читаемые истории о том, как жили, во что верили и как записывали мир люди в прошлом.

Цитирование: Zeng, S., Bai, J., Shi, J. et al. Human–computer collaborative approach to the decipherment of racle bone inscriptions with generative adversarial networks. npj Herit. Sci. 14, 232 (2026). https://doi.org/10.1038/s40494-026-02509-4

Ключевые слова: надпись на костях-оракулах, древнее письмо, ИИ для культурного наследия, сотрудничество человека и ИИ, эволюция китайского иероглифа