Clear Sky Science · ru

Лёгкая платформа FMCW-радаров для распознавания человеческой активности при ограниченном объёме данных

· Назад к списку

Наблюдение за повседневной жизнью без камеры

Представьте себе дом, который тихо обнаруживает, упал ли пожилой человек или долго ли кто‑то не двигается, — без камер, микрофонов или носимых устройств. В этой статье предложен новый подход, использующий компактные радарные датчики и эффективный искусственный интеллект для распознавания повседневных действий в обстановке, похожей на спальню, даже при небольшом объёме обучающих данных. Цель — создать практичные системы мониторинга, сохраняющие приватность и способные в перспективе работать на недорогих устройствах в реальных домах, больницах и центрах ухода.

Figure 1
Figure 1.

Почему радар, а не камеры или носимые устройства?

Многие современные системы мониторинга опираются на носимые устройства вроде умных часов или на видеокамеры, установленные в комнате. Носимые приборы могут быть неудобными, требуют подзарядки и часто забываются или снимаются, особенно во время сна или купания. Камеры вызывают очевидные опасения по поводу приватности и могут не работать при плохом освещении или когда человек за предметами мебели. Радар предлагает альтернативу: он испускает радиоволны и измеряет их отражения, чтобы оценить движение и положение. Миллиметроволновой радар работает в темноте, сквозь некоторые препятствия и не раскрывает внешний вид человека, что делает его привлекательным для уважительного и непрерывного наблюдения за повседневной жизнью.

Преобразование невидимых волн в полезные шаблоны

Исследователи использовали компактный радарный датчик на частоте 60 ГГц, установленный высоко в комнате, похожей на спальню, с наклоном вниз, чтобы покрыть кровать, кресло и пол. Три добровольца приняли участие в 16 сессиях записи, выполняя семь категорий действий: комната пуста, ходьба, сидение на кровати, сидение в кресле, лежание на кровати, лежание на полу и переходы между этими состояниями. Вместо того чтобы преобразовывать радарные сигналы в изображения, как во многих ранних работах, команда сохранила данные в форме, напрямую отражающей физические величины: расстояние до радара, скорость движения и направление с разных углов. Из каждого радарного кадра они извлекли три типа карт признаков — дальность–Доплер (движение относительно расстояния), дальность–азимут (горизонтальный угол) и дальность–элевейшн (вертикальный угол) — и сложили их в компактные многомерные векторы, сохраняющие информацию о том, как тело человека движется в пространстве во времени.

Figure 2
Figure 2.

Лёгкий интеллект для небольших устройств

Для чтения этих радарных шаблонов авторы создали модель глубокого обучения, преднамеренно небольшую и эффективную. Она сочетает оптимизированную версию популярной сети для распознавания изображений (ResNet-18) с двунаправленным модулем LSTM — разновидностью рекуррентной нейронной сети. Специализированные «глубинно-сепарабельные» свёртки существенно сокращают число вычислений и параметров, при этом сохраняя важные пространственные детали, а рекуррентная часть обучается распознавать развитие действий в коротких временных окнах примерно полсекунды. Чтобы повысить устойчивость системы при наличии данных только от трёх людей, команда применила реалистичные приёмы аугментации: небольшие сдвиги положения или скорости, масштабирование и смещение интенсивности сигнала, инверсия направления движения и добавление лёгкого шума — имитируя вариации реальных домов и людей от момента к моменту.

Насколько хорошо система распознаёт повседневные действия?

Платформа была протестирована с использованием двух строгих стратегий оценки. При проверке cross-scene модель обучали на большинстве сессий записи и тестировали на сценах, которых она ранее не видела. В тестировании leave-one-person-out модель обучали на данных двух участников и полностью тестировали на третьем, исследуя, насколько хорошо она обобщает на новых людей. В задаче с семью сложными классами система достигла примерно 92% точности и почти 90% F1‑метрики при удержании сцен, и около 90% точности на невидимых людях. Когда задачу упростили до четырёх основных действий — ходьба, сидение на кровати, сидение в кресле и лежание на кровати — точность в cross-scene тестах выросла до примерно 99%. Примечательно, что такие результаты соответствуют или превосходят производительность более крупных и вычислительно затратных нейросетей, при этом модель использует менее миллиона параметров и занимает менее 7 мегабайт.

Что это может значить для будущих умных домов

Проще говоря, исследование показывает, что компактный радар и небольшой ИИ‑модуль могут надёжно отличать распространённые бытовые действия, даже при ограниченных обучающих данных и без посягательства на приватность. Работая напрямую с физически значимыми радарными признаками и с тщательно подобранными методами аугментации, авторы добиваются и точности, и эффективности, делая подход пригодным для встроенного оборудования на периферии, а не для громоздких серверов в облаке. По мере расширения наборов данных, чтобы охватить больше людей и типов поведения, подобный радарный мониторинг может стать основой для будущих «умных» спален, палат и учреждений с поддержкой жизни, которые ненавязчиво следят за безопасностью и благополучием, сохраняя достоинство и приватность людей.

Цитирование: Fard, A.S., Mashhadigholamali, M., Zolfaghari, S. et al. Lightweight FMCW radar framework for human activity recognition under limited data conditions. Sci Rep 16, 9650 (2026). https://doi.org/10.1038/s41598-026-44815-8

Ключевые слова: распознавание активности на основе радаров, FMCW миллиметроволновой радар, мониторинг умного дома, лёгкое глубокое обучение, помощь в быту и уходе