Clear Sky Science · ru
Лёгкая платформа FMCW-радаров для распознавания человеческой активности при ограниченном объёме данных
Наблюдение за повседневной жизнью без камеры
Представьте себе дом, который тихо обнаруживает, упал ли пожилой человек или долго ли кто‑то не двигается, — без камер, микрофонов или носимых устройств. В этой статье предложен новый подход, использующий компактные радарные датчики и эффективный искусственный интеллект для распознавания повседневных действий в обстановке, похожей на спальню, даже при небольшом объёме обучающих данных. Цель — создать практичные системы мониторинга, сохраняющие приватность и способные в перспективе работать на недорогих устройствах в реальных домах, больницах и центрах ухода.

Почему радар, а не камеры или носимые устройства?
Многие современные системы мониторинга опираются на носимые устройства вроде умных часов или на видеокамеры, установленные в комнате. Носимые приборы могут быть неудобными, требуют подзарядки и часто забываются или снимаются, особенно во время сна или купания. Камеры вызывают очевидные опасения по поводу приватности и могут не работать при плохом освещении или когда человек за предметами мебели. Радар предлагает альтернативу: он испускает радиоволны и измеряет их отражения, чтобы оценить движение и положение. Миллиметроволновой радар работает в темноте, сквозь некоторые препятствия и не раскрывает внешний вид человека, что делает его привлекательным для уважительного и непрерывного наблюдения за повседневной жизнью.
Преобразование невидимых волн в полезные шаблоны
Исследователи использовали компактный радарный датчик на частоте 60 ГГц, установленный высоко в комнате, похожей на спальню, с наклоном вниз, чтобы покрыть кровать, кресло и пол. Три добровольца приняли участие в 16 сессиях записи, выполняя семь категорий действий: комната пуста, ходьба, сидение на кровати, сидение в кресле, лежание на кровати, лежание на полу и переходы между этими состояниями. Вместо того чтобы преобразовывать радарные сигналы в изображения, как во многих ранних работах, команда сохранила данные в форме, напрямую отражающей физические величины: расстояние до радара, скорость движения и направление с разных углов. Из каждого радарного кадра они извлекли три типа карт признаков — дальность–Доплер (движение относительно расстояния), дальность–азимут (горизонтальный угол) и дальность–элевейшн (вертикальный угол) — и сложили их в компактные многомерные векторы, сохраняющие информацию о том, как тело человека движется в пространстве во времени.

Лёгкий интеллект для небольших устройств
Для чтения этих радарных шаблонов авторы создали модель глубокого обучения, преднамеренно небольшую и эффективную. Она сочетает оптимизированную версию популярной сети для распознавания изображений (ResNet-18) с двунаправленным модулем LSTM — разновидностью рекуррентной нейронной сети. Специализированные «глубинно-сепарабельные» свёртки существенно сокращают число вычислений и параметров, при этом сохраняя важные пространственные детали, а рекуррентная часть обучается распознавать развитие действий в коротких временных окнах примерно полсекунды. Чтобы повысить устойчивость системы при наличии данных только от трёх людей, команда применила реалистичные приёмы аугментации: небольшие сдвиги положения или скорости, масштабирование и смещение интенсивности сигнала, инверсия направления движения и добавление лёгкого шума — имитируя вариации реальных домов и людей от момента к моменту.
Насколько хорошо система распознаёт повседневные действия?
Платформа была протестирована с использованием двух строгих стратегий оценки. При проверке cross-scene модель обучали на большинстве сессий записи и тестировали на сценах, которых она ранее не видела. В тестировании leave-one-person-out модель обучали на данных двух участников и полностью тестировали на третьем, исследуя, насколько хорошо она обобщает на новых людей. В задаче с семью сложными классами система достигла примерно 92% точности и почти 90% F1‑метрики при удержании сцен, и около 90% точности на невидимых людях. Когда задачу упростили до четырёх основных действий — ходьба, сидение на кровати, сидение в кресле и лежание на кровати — точность в cross-scene тестах выросла до примерно 99%. Примечательно, что такие результаты соответствуют или превосходят производительность более крупных и вычислительно затратных нейросетей, при этом модель использует менее миллиона параметров и занимает менее 7 мегабайт.
Что это может значить для будущих умных домов
Проще говоря, исследование показывает, что компактный радар и небольшой ИИ‑модуль могут надёжно отличать распространённые бытовые действия, даже при ограниченных обучающих данных и без посягательства на приватность. Работая напрямую с физически значимыми радарными признаками и с тщательно подобранными методами аугментации, авторы добиваются и точности, и эффективности, делая подход пригодным для встроенного оборудования на периферии, а не для громоздких серверов в облаке. По мере расширения наборов данных, чтобы охватить больше людей и типов поведения, подобный радарный мониторинг может стать основой для будущих «умных» спален, палат и учреждений с поддержкой жизни, которые ненавязчиво следят за безопасностью и благополучием, сохраняя достоинство и приватность людей.
Цитирование: Fard, A.S., Mashhadigholamali, M., Zolfaghari, S. et al. Lightweight FMCW radar framework for human activity recognition under limited data conditions. Sci Rep 16, 9650 (2026). https://doi.org/10.1038/s41598-026-44815-8
Ключевые слова: распознавание активности на основе радаров, FMCW миллиметроволновой радар, мониторинг умного дома, лёгкое глубокое обучение, помощь в быту и уходе