Clear Sky Science · ru

Обработка информации надписей на гадательных костях: всеобъемлющее обозрение

· Назад к списку

Древние кости, современные вопросы

Более 3000 лет назад китайские гадатели вырезали вопросы правителям на панцирях черепах и костях быков, затем раскалывали их нагревом, чтобы читать предзнаменования. Эти надписи на гадательных костях — самое раннее известное китайское письмо и редкий источник сведений о политике, религии и повседневной жизни бронзового века. Сегодня же кости сильно повреждены, письмо трудно прочитать, и многие знаки остаются нерасшифрованными. В этой статье объясняется, как новые волны искусственного интеллекта меняют способы очистки, восстановления, чтения и интерпретации этих хрупких следов прошлого и какие сложности по-прежнему мешают прогрессу.

Figure 1
Figure 1.

От руки и глаза к кремнию и коду

В течение большей части прошлого века изучением гадательных костей занимался узкий круг специалистов, которые кропотливо исследовали тушевые оттиски, обводки и фотографии. Они сопоставляли массивные печатные каталоги, предлагали чтения отдельных знаков и спорили о датировке и группировке надписей. Эта работа заложила основы области, но была медленной, трудно воспроизводимой и сильно зависела от личной памяти и суждений каждого учёного. С появлением компьютеров исследователи начали оцифровывать оттиски и применять простые приёмы обработки изображений — повышение контраста, обнаружение границ. Эти ранние инструменты облегчали обозрение и обмен материалами, но рассматривали знаки лишь как формы, а не как осмысленное письмо.

Глубокое обучение входит в архивы

Появление глубокого обучения изменило ландшафт. Свёрточные нейросети и трансформеры, изначально отточенные на обычных фотографиях, были дообучены для выделения знаков на шумных оттисках, их классификации и даже помощи в сопоставлении сломанных фрагментов, некогда принадлежавших одной и той же кости. Чтобы накормить эти требовательные к данным модели, команды собрали десятки специализированных наборов: одни фокусировались на обнаружении всех знаков на оттиске, другие — на классификации обрезанных глифов, связывании радикалов и компонентов или сопоставлении древних форм с более поздними скриптами. Однако данные отражают историческую реальность: несколько распространённых знаков встречаются тысячи раз, тогда как многие редкие или нерасшифрованные символы появляются лишь однажды. Исследователи отвечают хитрыми приёмами аугментации данных, генеративными моделями, синтезирующими новые примеры, и схемами обучения, рассчитанными на распознавание знаков по нескольким — или вовсе по отсутствующим — известным образцам.

Обучение машин связывать образ и смысл

На последней фазе к гадательным костям адаптируются большие мультимодальные модели, объединяющие зрение и язык. Вместо того чтобы исключительно находить положение знаков, эти системы пытаются связать внешний вид глифа с его возможным значением, подобно тому, как это делает человек-палеограф. Новые эталоны проверяют, могут ли такие модели распознавать знаки, склеивать фрагменты, извлекать похожие надписи и предлагать правдоподобные чтения. Некоторые подходы стремятся отображать древние знаки напрямую на современные китайские иероглифы, отслеживая визуальную эволюцию на протяжении веков; другие связывают пиктограммы с изображениями реальных предметов; третьи пытаются дать полные текстовые пояснения тому, что могла означать гадательная строка. Системы в стиле агентов идут дальше, оркеструя множество инструментов и баз данных и помогая пользователям искать по изображениям, транскрипциям и научным заметкам в одном рабочем процессе.

Figure 2
Figure 2.

Данные, оценка и головоломка разрушенной истории

Несмотря на быстрый прогресс, обзор выявляет упрямые препятствия. Многие лучшие коллекции изображений и 3D-сканы находятся в музеях или частных архивах и недоступны публике, что затрудняет объективное сравнение методов и обучение по-настоящему общих моделей. Даже общедоступные наборы данных часто имеют длиннохвостое распределение классов, непоследовательные метки или низкое качество изображений. Стандартные показатели эффективности, заимствованные из задач обнаружения объектов или распознавания рукописного текста, могут не отражать того, что действительно важно для историков — например, путает ли модель два признанных варианта одного и того же знака или уважает ли предложенное чтение структурный состав знака из меньших частей. Человеческая оценка также фрагментирована: в разных исследованиях участвуют разные типы экспертов, задают разные вопросы и редко приводят достаточно подробные отчёты, чтобы другие могли воспроизвести тесты.

Где древнее письмо встречается с будущим ИИ

Для продвижения вперёд авторы выступают за более богатые и хорошо документированные наборы данных; методы оценки, поощряющие структурное и семантическое понимание, а не только сопоставление пикселей; и более тесное сотрудничество между технолoгами и специалистами по раннему китайскому письму. Они представляют себе генераторы «текст-в-изображение», способные создавать реалистичные символы в стиле гадательных костей по описанию, базовые модели, обученные специально на древних письмах, мультиагентные системы, которые спорят и уточняют альтернативные чтения, и даже 3D-реконструкции, восстанавливающие исходную форму разбитых костей. Проще говоря, вывод статьи в том, что ИИ сам по себе не «решит» загадку гадательных костей, но может стать мощным партнёром — усиливая экспертную интуицию, делая огромные архивы доступными для поиска и открывая голоса бронзового века гораздо широкой аудитории.

Цитирование: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w

Ключевые слова: надписи на гадательных костях, древнекитайская письменность, цифровые гуманитарные науки, искусственный интеллект, мультимодальные модели