Clear Sky Science · ru

Применение алгоритма PoseConv3D для распознавания движений в тренировках по черлидингу

2026-03-05 · Назад к списку

Более умный коучинг для динамичного вида спорта

Современный черлидинг — это не просто поддержка с бровки: это требовательный акробатический командный вид спорта, где малейшая ошибка в тайминге или позе может означать разницу между чистым трюком и опасным падением. Тем не менее большинство тренировок по-прежнему полагаются на глаз тренера и медленные повторы видео. В этой статье представлен искусственный интеллект, который может просматривать номера по кадрам, определять положение тел спортсменов и автоматически распознавать выполняемый элемент и его сложность, открывая путь к более безопасным, точным и персонализированным тренировкам.

Почему черлидинг — особая задача

Многие виды спорта и повседневные действия уже изучены методами компьютерного зрения, но черлидинг ставит существующие подходы в затруднительное положение. Спортсмены вращаются несколько раз в секунду, переворачиваются в воздухе и строят многочленные пирамиды, где тела перекрывают друг друга и закрывают обзор камеры. Движения, которые выглядят похоже в пространстве — например, волнообразное движение рук и высокий удар ногой — могут различаться в первую очередь ритмом, что стандартные алгоритмы в значительной степени игнорируют. В результате распространённые системы распознавания действий ошибочно определяют ключевые суставы, теряют трек отдельных участников при групповом трюке и путают элементы с похожими траекториями движения, что приводит к низкой точности и ненадёжной обратной связи в реальных залах.

Преобразование видео в чистые цифровые скелеты

Новая система опирается на 3D-сверточную сеть для поз, называемую PoseConv3D, которая работает не с сырыми пикселями, а с упрощёнными «палочковыми» скелетами, извлечёнными из видео. Первое новшество — динамический шаг коррекции, который очищает эти скелеты. Когда детектор позы не уверен в положении сустава — например, запястье размывается при вращении — система предсказывает наиболее вероятный путь этого сустава во времени, используя сглаженные кривые, учитывающие движение соседних кадров. Это снижает дрожание и сдвиг положений суставов более чем на 40%, давая алгоритму обучения гораздо более чёткое представление о том, как действительно движется тело спортсмена во время быстрых вращений и воздушных переходов.

Видеть и мелкие детали, и крупные командные паттерны

После очистки скелетов система анализирует движение сразу на нескольких масштабах. Одна ветвь обработки фокусируется на тонких деталях, таких как быстрый взмах запястья или отталкивание стопы, в то время как другая рассматривает более широкие паттерны — например, дугу маха ноги или согласованный подъём нескольких спортсменов при подъёме. Объединяя эти представления, модель лучше понимает, как мелкие корректировки влияют на крупные командные формации. Тесты на специализированном датасете по черлидингу Университета Центральной Флориды — более 500 HD клипов тренировок и соревнований с тщательно размеченными элементами и уровнями сложности — показывают, что такой мульти‑масштабный подход заметно улучшает распознавание сложных, высококоординированных трюков.

Обучение системы «слышать» ритм

Выдающаяся особенность работы — алгоритм учится не только как спортсмены двигаются в пространстве, но и когда они это делают. Исследователи вычисляют скорость перемещения каждого сустава от кадра к кадру и преобразуют эти изменения в ритмические паттерны, подобно тому как музыка превращается в спектр тактов. Специальный модуль внимания затем выделяет моменты в последовательности движений, соответствующие ключевым ритмическим подписи. Это позволяет системе надёжно различать действия, которые описывают почти одинаковые траектории, но разворачиваются в разном темпе, сокращая путаницу между волнообразными движениями и синхронизированными ударами примерно с одного случая из шести до лишь нескольких случаев из ста.

От распознавания — к реальному партнёру по тренировкам

На выходе конвейера система одновременно даёт два результата: тип выполняемого элемента черлидинга и оценку сложности, согласованную с соревновательными правилами. Работая почти на 90 кадрах в секунду, она с запасом превышает скорость, необходимую для обратной связи в реальном времени. Общая точность достигает около 93%, значительно превосходя несколько современных методов. Для спортсменов и тренеров это означает автоматизированного помощника, который может в реальном времени отмечать несвоевременные волны, нестабильные приземления или пробелы в синхронизации команды, а также отслеживать прогресс в освоении всё более сложных навыков — делая важный шаг к основанным на данных, более безопасным и тонко настроенным тренировкам по черлидингу.

Цитирование: Li, Q. Application of PoseConv3D algorithm in cheerleading training action recognition. Sci Rep 16, 12265 (2026). https://doi.org/10.1038/s41598-026-43019-4

Ключевые слова: чёрлидинг, распознавание движений, оценка позы, спортивная аналитика, глубокое обучение