Clear Sky Science · ru

Логико-основанная знаниевая двунаправленная GRU с мульти-вниманием для классификации уровня страха у людей

2026-03-14 · Назад к списку

Почему важно читать страх по телу

Страх — это не просто ощущение в животе: он изменяет сердечный ритм, потоотделение и даже электрическую активность мозга. Если компьютеры научатся надёжно считывать эти тонкие изменения, терапевты смогут отслеживать тревогу в реальном времени, автомобили и роботы — реагировать на панику людей, а виртуальная реальность — адаптироваться, чтобы обеспечить безопасность пользователей. В этом исследовании изучается, как научить машины распознавать разные уровни страха у людей, объединяя сигналы мозга и тела со структурированным правиловым рассуждением, стремясь создать системы, которые одновременно точны и понятны человеку.

Слушая мозг и тело

Исследователи исходят из идеи, что ни одно отдельное измерение не может полностью отразить страх. Поэтому они объединяют несколько типов физиологических сигналов: электрическую активность мозга, проводимость кожи, которая повышается при потоотделении, изменения сердечного ритма, дыхательные паттерны и мимику лица. Используются два существующих экспериментальных набора данных. Один, называемый DEAP, фиксирует сигналы мозга и тела у людей, которые смотрят музыкальные клипы и оценивают, насколько приятными и интенсивными были ощущения. Другой, DECAF, использует сканирование мозга и датчики тела, пока люди смотрят пугающие сценки из фильмов или слушают музыку. Эти мультимодальные наборы дают богатую картину того, как страх проявляется в нервной системе.

Преобразование сырых сигналов в простые правила

Сырые сигналы шумные и их трудно интерпретировать, поэтому команда сводит их к признакам с известными связями с эмоциями. Например, они вычисляют «фронтальную альфа-асимметрию» — паттерн в мозговых волнах над лбом, часто связанный с негативным настроением, и считают пики в электрической реакции кожи, которые обычно растут при стрессе. Также сигналы мозга разделяют на классические частотные диапазоны — дельта, тета, альфа, бета и гамма — и суммируют вариабельность сердечного ритма. Вместо того чтобы подавать эти непрерывные величины прямо в непрозрачную модель, они вводят логико-основанное обучение: каждый признак оценивается как «высокий» или «низкий» с помощью статистически выбранных порогов. Из этих бинарных элементов алгоритм индуктивного логического программирования выводит читаемые человеком IF–THEN правила, например комбинации высокой кожной реакции и низкой вариабельности сердца, которые надёжно указывают на страх.

Сочетание правил с глубоким обучением

Пока логические правила делают решения более понятными, современные модели глубокого обучения лучше извлекают максимальную предсказательную силу из сложных данных. Авторы поэтому рассматривают выходы логики как единственные входы для нескольких архитектур нейронных сетей, разработанных для временных сигналов. Сюда входят стандартные рекуррентные сети, сети долгой кратковременной памяти (LSTM), более простые сдутые рекуррентные блоки (GRU) и продвинутая архитектура — двунаправленная GRU с мульти-вниманием. Эта последняя модель не только просматривает последовательность признаков в обе стороны, но и использует механизмы внимания, чтобы фокусироваться на наиболее информативных моментах — например, резких всплесках проводимости кожи или внезапных сдвигах мозговых ритмов — игнорируя несущественные флуктуации.

Насколько хорошо система распознаёт страх

Чтобы проверить подход, команда сравнивает модели, обученные на одних и тех же входах с логико-основанным слоем и без него. Они оценивают их по точности разделения «нет страха» и «страх», а в данных DEAP — по способности различать четыре уровня от отсутствия страха до сильного страха. В ходе обширной кросс-валидации и статистических тестов добавление логических правил последовательно улучшает производительность и делает результаты более стабильными между разными разбиениями. Лидирующая архитектура — знание-ориентированная двунаправленная GRU с мульти-вниманием — достигает примерно 96.7% точности на наборе DEAP и аналогично высокой работы на музыкальных отрывках в DECAF, превосходя несколько ранее опубликованных методов и более традиционные техники машинного обучения.

Что это означает для будущих инструментов, чувствительных к эмоциям

Проще говоря, исследование показывает, что компьютеры могут с впечатляющей надёжностью оценивать уровень страха человека, когда они считывают множественные сигналы тела и мозга и интерпретируют их через ясные, правилоподобные знания перед применением глубокого обучения. Такой гибридный дизайн сочетает лучшее из двух миров: мощь современных нейросетей и прозрачность логических правил, которые эксперты могут просматривать и уточнять. Такой подход может лечь в основу будущих систем мониторинга психического здоровья, адаптивных развлечений и систем безопасности, которые делают не просто предположения о наших эмоциях, а объясняют, почему они считают, что мы испытываем страх, открывая путь к более надёжным и персонализированным технологиям.

Цитирование: Joshva, A.A., Balasubramanian, V.K. & Murugappan, M. A logic-based knowledge-driven bidirectional multi-attention GRU framework for fear level classification in humans. Sci Rep 16, 13722 (2026). https://doi.org/10.1038/s41598-026-44151-x

Ключевые слова: распознавание эмоций, обнаружение страха, физиологические сигналы, глубокое обучение, интерпретируемый ИИ