Clear Sky Science · ru
Легковесный метод на основе YOLOv8n для обнаружения аномальной позы человека
Почему важно замечать необычные положения тела
Падения, внезапная боль в груди или обморок в коридоре часто происходят за считанные секунды, и если рядом никого нет, помощь может прийти слишком поздно. В этой работе представлена компактная система искусственного интеллекта, которая способна анализировать обычное видео с камер наблюдения или камер в домах ухода и автоматически в реальном времени сигнализировать о опасных, аномальных позах. Делая программное обеспечение одновременно точным и легковесным, авторы стремятся обеспечить надежное обнаружение падений и экстренных состояний на повседневных устройствах — от больничных мониторов до недорогих камер в домах пожилых людей.
От обычных камер к более продуманному наблюдению
Современные системы мониторинга уже используют компьютерное зрение для обнаружения людей и отслеживания их движений, но необычные позы особенно трудно распознать. Человек может выглядеть очень по‑разному при стоянии, держась за грудь, при рвоте или лежа на полу; такие события кратковременны, разнообразны и часто частично закрыты мебелью или плохим освещением. Существующие алгоритмы могут быть достаточно точными, но часто они громоздки и медлительны, требуя мощного оборудования и тонкой настройки. Авторы сосредоточились на том, чтобы сделать обнаружение быстрым и экономным в вычислениях, чтобы оно могло работать на распространённых графических процессорах или даже встраиваемых устройствах без потери надежности.

Более компактный «мозг» для распознавания рискованных поз
Сердцем работы является улучшенная версия популярной модели обнаружения объектов YOLOv8n. Исследователи создали более лёгкий, целенаправленный вариант, который они назвали PSD‑YOLOv8n. Во‑первых, они добавили новый модуль внимания PoseMSA, помогающий сети концентрироваться на наиболее информативных участках тела человека и игнорировать захламлённый фон. Это достигается с помощью оптимизированных операций, имитирующих взгляд как по всему изображению, так и через различные уровни признаков, усиливая сигналы, важные для оценки позы, при низкой вычислительной нагрузке. Во‑вторых, они переработали способ «возвращения» к деталям с помощью блока KA‑Sample для апсемплинга, который обучается подчёркивать области вокруг ключевых точек тела — головы, корпуса и конечностей — так, чтобы скрученные или упавшие позы были видны яснее.
Более точные рамки и ясные решения
Понимая, что аномальные позы часто сливаются с окружением — представьте человека, частично растянувшегося под столом — авторы также переработали финальную стадию принятия решения, называемую детекторной головой. Их модуль Detect‑PSA объединяет информацию с нескольких масштабов и применяет вероятностный подход к построению ограничивающих рамок. Вместо попытки провести одну жёсткую границу системы представляет каждую сторону рамки как небольшое распределение возможных положений и затем усредняет их. Такой подход делает контуры стабильнее, когда конечности укорочены перспективой, закрыты или вытянуты вдоль пола, что приводит к рамкам, которые в сложных сценах ближе соответствуют размеченным человеком эталонам.

Проверка системы на практике
Чтобы оценить эффективность своей схемы на практике, команда собрала специализированный набор изображений SSHDataset, сформированный из многокамерных внутренних видеозаписей, показывающих людей в четырёх состояниях: нормальное, боль в груди, рвота и падение. После тщательной ручной разметки и увеличения данных они обучили PSD‑YOLOv8n и ряд соперничающих моделей в идентичных условиях. По стандартным мерам точности их метод достиг показателя обнаружения 97,8% при распространённом пороге перекрытия и сохранил высокие результаты даже при жёстких критериях. При этом модель использовала всего около двух миллионов параметров и файл весов объёмом 4,5 мегабайта — примерно на треть меньше параметров и более чем на треть меньше вычислений по сравнению с оригинальным YOLOv8n — при скорости более 80 кадров в секунду. Испытания на независимом публичном датасете по обнаружению падений показали, что преимущества сохраняются и на новых данных, с особенно заметным улучшением в распознавании реальных падений.
Что это значит для повседневной безопасности
Проще говоря, исследование даёт компактного цифрового «спасателя», который может в реальном времени смотреть видео и надежно замечать, когда положение тела человека сигнализирует о беде. Тщательно переработав способы фокусировки на областях тела, восстановления мелких деталей и построения рамок вокруг людей, авторы добились редкого сочетания высокой точности, скорости и малого размера. Такая система может быть встроена в больничные мониторы, умные хабы для домов или камеры в общественных местах, чтобы своевременно отправлять оповещения о падениях или внезапном недомогании, даже в захламлённых помещениях и при различном освещении. По мере дальнейшего совершенствования и расширения подхода на длинные видеопоследовательности и новые окружения он может стать основой нового поколения тихих, постоянно работающих «стражей», помогающих сохранять безопасность уязвимых людей без постоянного контроля со стороны человека.
Цитирование: Li, G., Zhang, J., Ji, Q. et al. A lightweight YOLOv8n-based method for human abnormal posture detection. Sci Rep 16, 7222 (2026). https://doi.org/10.1038/s41598-026-37903-2
Ключевые слова: обнаружение падений, поза человека, компьютерное зрение, легковесный ИИ, уход за пожилыми