Clear Sky Science · ru

Мультимодальная пространственно-временная сверточная сеть с механизмом внимания для распознавания тревожного поведения спортсменов

· Назад к списку

Почему тревожные спортсмены имеют значение

Каждый, кто когда‑либо «завис» на важном экзаменационном вопросе или промахнулся по лёгкому броску в игре, знает, как нервы могут разрушить результат. Для соревнующихся спортсменов эта проблема имеет большие ставки: тревога может стоить медалей, стипендий и карьеры. Тем не менее большинство способов отслеживания нервозности спортсмена по‑прежнему полагаются на постфактум‑опросники и интуицию тренера. В этом исследовании предложена объективная система в реальном времени, которая наблюдает за телом и лицом спортсмена, фиксирует его физиологию и автоматически оценивает, насколько он взволнован во время соревнования.

Figure 1
Figure 1.

Видеть невидимые признаки нервозности

Исследователи исходят из простой идеи: тревога проявляется одновременно во множестве сигналов. Когда спортсмены переживают, меняется ритм сердца, потеют ладони, напрягается осанка, а тонкие движения лица выдают напряжение. Вместо того чтобы сосредотачиваться только на одном из этих признаков, команда объединяет несколько источников одновременно. Они собирают данные о частоте сердечных сокращений и кожной проводимости с носимых датчиков, высококачественное видео лиц и движений всего тела, а также стандартизированные психологические опросники, заполненные до и после реальных студенческих соревнований. В общей сложности 68 спортсменов из четырёх видов спорта дали более двух тысяч коротких фрагментов, каждый из которых помечен как «тревожный» или «спокойный» на основе известного опросника тревожности.

Обучение цифрового тренера читать игру

Чтобы превратить этот богатый поток сигналов в оценку тревоги, авторы разрабатывают глубокую нейросеть‑«тренера», специализирующуюся на шаблонах, разворачивающихся во времени. Их модель использует пространственно‑временную сверточную сеть — по сути серию фильтров, которые скользят не только по пространству (пиксели, точки тела, каналы датчиков), но и по времени. Это позволяет системе замечать как быстрые всплески напряжения, так и более постепенные накопления стресса в пределах 30‑секундного отрезка игры. Важный элемент: сеть обрабатывает каждый тип данных — физиологию, выражение лица и движение — по отдельной ветке прежде чем объединить их, так что сильные стороны одного канала могут компенсировать слабости другого, например частично закрытое лицо или кратковременные помехи в датчиках.

Дать модели возможность сфокусироваться на важном

Поскольку не каждый момент или сигнал одинаково информативны, исследователи добавляют механизм «внимания». Эта часть модели учится придавать больший вес кадрам и сигналам, которые лучше всего отличают тревогу от спокойствия. Например, всплеск кожной проводимости в паре с кратковременным сжатием челюсти и беспокойным движением ноги может получить больший вес, чем период ровного дыхания и нейтральной позы. Модуль внимания также в режиме реального времени оценивает, насколько можно доверять каждому потоку данных, смещая акцент, если, скажем, физиологические данные чистые, а видео зашумлено. Адаптируя фокус таким образом, система становится более устойчива к реальным условиям и лучше улавливает тонкие, ранние признаки нервозности.

Figure 2
Figure 2.

Насколько точна и практична система?

При сравнении с рядом существующих методов — включая классические алгоритмы машинного обучения, стандартные видеосети и глубокие модели в стиле Transformer — новая система показывает наилучшие результаты. Она правильно классифицирует уровни тревоги примерно в 95% случаев и достигает высокого баланса точности и полноты. Авторы систематически тестируют разные длины временных окон и показывают, что около 30 секунд данных дают наилучшее компромиссное решение между наличием достаточного контекста для фиксации эпизода тревоги и минимальной задержкой для обратной связи в реальном времени. Даже когда какой‑то тип данных отсутствует — например, активны только носимые датчики — система всё ещё работает достаточно хорошо, что указывает на её способность справляться с несовершенными полевыми условиями.

Что это значит для спортсменов и тренеров

Проще говоря, исследование демонстрирует, что компьютер может научиться распознавать тревогу спортсмена почти по ходу дела, используя смешение сигналов тела и поведения, и делать это надёжнее прежних инструментов. Вместо того чтобы полагаться только на то, как спортсмен рассказывает о своих ощущениях после события, тренеры и спортивные психологи могли бы получать непрерывные объективные оценки умственного напряжения во время тренировки и соревнований. Это могло бы позволить своевременно применять дыхательные упражнения, менять состав игроков или давать паузы до того, как тревога перерастёт в серьёзный провал в выступлении. Хотя система по‑прежнему требует нескольких датчиков и мощного оборудования, и должна внедряться при строгих гарантиях приватности, она указывает на будущее, в котором управление психологической стороной спорта станет таким же измеримым и основанным на данных, как отслеживание скорости или частоты сердечных сокращений.

Цитирование: Yang, F., Gong, F. A multimodal spatiotemporal convolutional network with attention mechanism for athlete anxiety behavior recognition. Sci Rep 16, 5237 (2026). https://doi.org/10.1038/s41598-026-36023-1

Ключевые слова: тревога спортсмена, спортивная психология, носимые датчики, мультимодальное глубокое обучение, мониторинг эмоций в реальном времени