Clear Sky Science · ru
Усиленная графами знаний кросс-модальная генеративно-состязательная сеть для реконструкции движений боевых искусств и сохранения наследия
Почему высокотехнологичное кунг-фу важно
Традиционные боевые искусства — это не просто эффектные удары и пируэты; это живые носители философии, практик для здоровья и культурной идентичности. Однако многие из этих навыков живут лишь в телах и воспоминаниях стареющих мастеров, и обычные видеозаписи не в состоянии полностью передать их глубину. В этой работе исследуется, как продвинутая система искусственного интеллекта может «выучить» боевые искусства в богатом, содержательном виде, чтобы будущие поколения могли изучать не только то, как выглядит движение, но и почему оно выполняется именно так. 
Проблема записи древних навыков на видео
Веками боевые искусства передавались от учителя к ученику, зачастую без обширных писаных записей. Современные камеры и костюмы для захвата движения помогают, но всё ещё недостаточны. Видео уплощает трёхмерные, полнотелесные действия в две плоскости, а даже сложные датчики могут не зафиксировать тонкие переносы веса, внутренние потоки силы или тактическую цель приёма. Существующие системы в основном фиксируют «что» делает тело — углы суставов и позиции — игнорируя культурные идеи и принципы боя, которые придают технике её душу. В результате архивные записи могут выглядеть верно для рядовых зрителей, но казаться неправильными для опытных практиков.
Цифровая карта боевой мудрости
Чтобы решить эту проблему, авторы сначала строят большой граф знаний по боевым искусствам — по сути цифровую карту понятий и связей. В неё включены отдельные техники, части тела, направления приложения силы, тренировочные прогрессии, ключевые идеи вроде «существенного и несущественного» веса и контексты применения приёмов. Связи выражают отношения типа «эта стойка является предпосылкой для того удара» или «это движение воплощает этот принцип». С помощью методов обучения на графах каждый элемент этой карты превращается в числовое представление, с которым может работать компьютер, при этом сохраняется структура экспертных знаний.
Обучение ИИ связывать слова, изображение и движение
Далее команда проектирует систему, которая может понимать боевые искусства через несколько представлений одновременно: видео выступлений, текстовые объяснения и точные данные захвата движения. Отдельные модули анализируют каждый вид — видеонейросеть изучает кадры по одному, языковая модель читает технические и исторические описания, а модель на основе графа отслеживает, как суставы двигаются во времени. Особый шаг выравнивания, управляемый графом знаний, заставляет эти разные представления сходиться во мнении о том, что такое конкретная техника. Это предотвращает усвоение ИИ вводящих в заблуждение шаблонов и помогает ему работать с редко встречающимися приёмами, соотнося их с более знакомыми через общие принципы.
Генерация движений, которые кажутся подлинными
На этой основе авторы строят механизм генерации движений, основанный на генеративно-состязательных сетях. Одна часть системы предлагает новые последовательности движений; три «критикующих» компонента оценивают их под разными углами: точность локальных поз, согласованность всего тела и стилистическая верность конкретному боевому искусству. На протяжении всего процесса граф знаний действует как наблюдающий мастер, корректируя ИИ, чтобы он избегал поз, нарушающих равновесие, нарушающих правила стиля или игнорирующих ключевые фазы техники. В тестах на шести крупных китайских стилях система снизила ошибку положения суставов более чем на четверть по сравнению с сильными современными базовыми моделями и получила высокие оценки за соблюдение закодированных боевых принципов. 
Больше, чем красивые па: сохранение живых традиций
Для неспециалистов ключевая мысль в том, что речь идёт не просто о более плавной компьютерной анимации. Внедряя экспертные правила и культурное значение в ядро модели ИИ, метод позволяет реконструировать формы, которые одновременно физически корректны и верны характеру каждого стиля — от плавных кругов багуа-чжан до взрывных линий синьицюань. Авторы утверждают, что такие системы, управляемые знаниями, могут лежать в основе будущих обучающих инструментов, музейных экспозиций и цифровых архивов, позволяющих людям интерактивно изучать традиционные искусства даже без присутствия мастера. При дальнейшем развитии тот же подход может помочь сохранить и другие уязвимые практики, такие как классический танец или ритуальные представления, предлагая новый путь, при котором технологии поддерживают, а не заменяют человеческую традицию.
Цитирование: Yue, X., Zhang, L. Knowledge graph enhanced cross modal generative adversarial network for martial arts motion reconstruction and heritage preservation. Sci Rep 16, 5925 (2026). https://doi.org/10.1038/s41598-026-36095-z
Ключевые слова: сохранение боевых искусств, генерация человеческого движения, графы знаний, кросс-модальный ИИ, генеративно-состязательные сети