Clear Sky Science · ru
OBI designer: генерация художественных символов надписей на гадательных костях в режиме zero-shot с мультимодальным переносом стиля
Оживляя древние символы
Более трёх тысяч лет назад в Китае люди вырезали вопросы богам на панцирях черепах и на костях животных. Символы, которые они использовали, известные как надписи на гадательных костях, представляют собой самую древнюю известную форму китайского письма и обладают поразительной, образной красотой. Сегодня художники и дизайнеры хотят использовать эти формы в логотипах, постерах, играх и культурных продуктах — но делать это вручную медленно и требуется редкая экспертиза. В статье представлена система искусственного интеллекта под названием OBI-Designer, которая автоматически превращает эти древние знаки в новые выразительные произведения, сохраняя их узнаваемость и уважительное отношение к происхождению. 
Почему эти древние знаки важны
Надписи на гадательных костях — это не просто древнее письмо; каждый знак — крошечная картинка, дающая подсказку к значению — пламя для «огня», животное для «лошади», стилизованное лицо для частей тела. Благодаря этой пиктографической природе они являются богатым источником для современной визуальной графики, каллиграфии и культурного брендинга. Однако существуют несколько препятствий. Цифровые версии символов ограничены, что мешает обучению больших ИИ-моделей. Если художники слишком изменяют формы, символы теряют историческую аутентичность и становятся нечитаемыми. А «художественное ощущение» субъективно, что затрудняет его измерение или автоматизацию. Авторы ставят цель преодолеть все три проблемы одновременно: создать систему, которой требуется мало данных, сохраняющую читаемость и при этом допускающую смелую визуальную креативность.
Создание лучшего цифрового алфавита
Первый шаг — создать более точную цифровую версию оракульных знаков. Существующие компьютерные шрифты описывают каждый глиф всего несколькими контрольными точками, что затрудняет их плавную трансформацию. Исследователи тщательно переработали коммерческий шрифт гадательных костей так, чтобы каждый знак был восстановлен из множества мелких кривых. Адаптивный алгоритм добавляет дополнительные точки только там, где это действительно необходимо — например, в острых углах или плотных изгибах — не загромождая простые участки. В результате получился новый набор данных, в котором каждый символ хранится как гибкий контур, способный грациозно сгибаться и растягиваться. Эта геометрическая основа позволяет системе ИИ изменять формы тонко и контролируемо, а не искажать их случайно.
От простого контура к умной форме
Далее OBI-Designer преобразует эти контуры, чтобы отразить смысл выбранного слова или фразы. На первом этапе, называемом синтезом глифов, система берёт базовый знак и текстовый запрос вроде «голова собаки». Она рендерит контур как изображение, подаёт его в мощную модель генерации изображений и спрашивает: «Какой была бы картинка, соответствующая этой фразе?» Вместо того чтобы позволить модели полностью выдумать новое изображение, система использует внутренние сигналы модели как мягкое руководство, аккуратно подталкивая контрольные точки исходного знака. Дополнительные правила действуют как рельсы: одно ограничение не даёт слишком сильно менять углы маленьких треугольников внутри контура, другое сохраняет общую светотеневую структуру знака. Вместе эти ограничения позволяют глифу приобрести новые семантически значимые черты — уши, хвосты или пламя — оставаясь при этом достаточно близким по структуре, чтобы его можно было прочитать как тот же древний символ.
Наносим текстуру, не теряя рисунка
На втором этапе, называемом синтезом текстуры, OBI-Designer фокусируется на поверхностном стиле. Сначала он трассирует уточнённый контур, чтобы захватить ключевые штрихи и края. Специализированная сеть затем использует эту карту краёв как чертёж, следя за тем, чтобы любое сгенерированное изображение строго соответствовало исходной структуре. Поверх этого ещё одна лёгкая техника донастройки правит лишь небольшой частью модели изображения, позволяя ей выучить конкретные виды внешности — например аппликацию из вырезанной бумаги, кисть и тушь, резьбу по дереву, неоновое свечение или граффити — без перетренировки всей системы. Итоговое изображение сочетает чёткие, правдивые линии с богатой вариативностью поверхностей, давая дизайнерам набор стилей, которые все происходят из одних и тех же исторических корней. 
Тестирование красоты и ясности
Чтобы проверить, остаются ли эти произведения «читаемыми» как надписи на гадательных костях, авторы пропускают их через компьютерную систему, обученную распознавать оригинальные надписи. Эта система правильно идентифицирует сгенерированные ИИ-символы почти в 94 процентах случаев, лишь немного уступая своей точности на нетронутых оригиналах. Человеческие добровольцы с некоторыми знаниями древнего письма также оценивают новые символы выше, чем результаты нескольких соперничающих методов, считая их более структурно полными, семантически уместными и визуально привлекательными. Дальнейшие эксперименты показывают тонкий баланс: добавление большего числа геометрических контрольных точек позволяет системе продвигать дизайн в более драматичные, образные формы, но слишком много точек снижает машинную читаемость. Эта компромиссная настройка даёт пользователям ясный регулятор выбора между разборчивостью и художественной свободой.
Новые произведения из старых костей
Проще говоря, OBI-Designer — это умный помощник для превращения одних из древнейших письменных символов человечества в свежие современные произведения. Он уважает основные формы, которые придают надписям на гадательных костях историческое значение, и при этом использует передовые модели изображений для предложения новых форм и текстур. Авторы подчёркивают, что такие инструменты должны ясно маркировать свой вывод как сгенерированный ИИ, чтобы избежать путаницы с подлинными археологическими находками. В перспективе тот же подход может помочь возродить другие древние письменности, предоставляя музеям, преподавателям и создателям способ отмечать культурное наследие через живой, развивающийся визуальный дизайн, а не запирать его в архивах.
Цитирование: Zhang, J., Deng, F., Yuan, J. et al. OBI designer: zero-shot oracle bone inscription artistic characters generation with multimodal style transfer. npj Herit. Sci. 14, 152 (2026). https://doi.org/10.1038/s40494-026-02417-7
Ключевые слова: надписи на гадательных костях, генерация художественного текста, культурное наследие, диффузионные модели, стилизация шрифтов