Clear Sky Science · ru

Интерпретируемое и компактное обнаружение падений в музейной галерее с помощью YOLOv11-SEFA для Edge‑развертывания

· Назад к списку

Почему безопасность в галереях важна

По мере старения общества всё больше пожилых людей посещают музеи и выставочные галереи — красивые пространства, которые изначально не проектировались с учётом современных систем мониторинга. Простое падение в таких местах может привести к серьёзным травмам, однако прокладка новых датчиков или постоянный просмотр видеопотоков дорогостоящи, навязчивы и часто непрактичны. В этой статье исследуется новый способ автоматического и быстрого обнаружения падений в подобных помещениях с использованием компактного искусственного интеллекта, который может работать близко к самим камерам, не захламляя сеть видео и не нарушая приватность посетителей.

Figure 1
Figure 1.

Сложное место для наблюдения

В качестве полигона для испытаний выбран Rochfort Gallery в Норт‑Сиднее — отреставрированное здание 1920‑х годов с высокими потолками, декоративными отделками, блестящими полами и стеклянными витринами. Эти особенности делают пространство привлекательным для людей, но сложным для машин: свет отражается от стекла, тени меняются в течение дня, а потоки посетителей то увеличиваются, то спадают. Правила охраны наследия также ограничивают сверление, прокладку кабелей и установку громоздкого оборудования. Авторы утверждают, что система обнаружения падений в таких условиях должна быть компактной, энергоэффективной и уважительной к приватности, при этом достаточно надёжной, чтобы помогать персоналу в обеспечении безопасности уязвимых посетителей.

Обучение компьютера распознавать падение

Для обучения системы команда не ограничилась небольшой постановочной выборкой. Вместо этого они расширили существующую коллекцию изображений тысячами дополнительных фотографий, сделанных в музеях, галереях и общественных центрах. Каждое изображение было помечено как нормальная поза (например, стоя или при ходьбе) или поза падения (лежа на полу в разных ориентациях) и снято с разных ракурсов — потолочных, боковых и на уровне глаз — в условиях от дневного света до тусклого освещения со световыми пятнами. Также намеренно включали сцены с частичной заслонённостью мебелью или другими посетителями и с толпами, чтобы отразить загромождённость и хаос реальных общественных пространств.

Лёгкий «умный наблюдатель» на Edge

Ядро системы — упрощённая сеть обнаружения объектов под названием YOLOv11‑SEFA, которая анализирует каждый кадр с камеры и решает, произошло ли падение. Вместо создания более тяжёлой и сложной модели авторы внесли два направленных изменения в существующий быстрый детектор, чтобы он уделял больше внимания небольшим или частично скрытым телам и зонам контакта человека с полом. Это повышает и долю реально пойманных падений, и точность ограничивающих рамок, при этом сохраняя низкую вычислительную нагрузку, достаточную для работы на скромных «edge»‑компьютерах, установленных в здании. Тесты по сравнению с несколькими популярными альтернативами показывают, что эта настроенная модель предлагает одно из лучших соотношений между точностью и скоростью, требуя лишь небольшого прироста вычислений по сравнению с исходной версией.

От простых сигналов к градуированному риску

Вместо простого «падение/нет падения» система делает шаг вперёд и присваивает каждому обнаруженному событию уровень риска от 0 до 3. Для этого визуальное обнаружение преобразуется в шесть простых числовых показателей: какую часть изображения занимает человек, насколько он наклонён, на каком расстоянии он находится от камеры, насколько растянута или сплющена его контурная форма, насколько визуально загружена окружающая область и сколько других людей присутствует. Отдельная модель принятия решений, вдохновлённая мнениями экспертов по безопасности, объединяет эти значения в четыре диапазона: нормальная активность, необычная поза с низким риском, средне‑высокий риск и очевидные, высокорисковые падения. Важно, что авторы используют инструмент объяснения, чтобы подтвердить: модель действительно опирается преимущественно на признаки, связанные с позой — такие как наклон и форма тела — а не на нерелевантные детали фона.

Figure 2
Figure 2.

Испытания в реальной галерее

Полная система связывает камеры, локальные edge‑компьютеры и облачный сервис в четырёхслойный конвейер. Камеры передают видео с пониженной частотой на компактные машины на том же этаже, которые запускают детектор падений и формируют оповещения; в облако отправляются только короткие отрезки или наложения в виде тепловых карт по необходимости, что ограничивает как пропускную способность, так и раскрытие приватной информации. В ходе 72‑часового пилота в Rochfort Gallery система поддерживала время отклика около четверти секунды даже в переполненных сценах и давала менее полусрабатывания ложной тревоги в час в пиковые периоды — в основном из‑за посетителей, приседающих чтобы сфотографироваться — при этом все постановочные испытательные падения были обнаружены. Авторы подчёркивают, что эти цифры получены в относительно коротком контролируемом испытании, но показывают, что подход технически работоспособен в требовательной реальной обстановке.

Что это означает для будущих общественных пространств

Для неспециалистов ключевой результат в том, что теперь возможно добавить автоматический, градуированный слой предупреждения о падениях к существующим системам видеонаблюдения в исторических галереях и похожих общественных зданиях без масштабной реконструкции или постоянного человеческого контроля. Запуская эффективный детектор на небольших локальных компьютерах и тщательно структурируя интерпретацию и обмен результатами, система демонстрирует первые доказательства того, что технология может незаметно стоять на страже — обнаруживая вероятные падения, указывая на степень их серьёзности и делая это на скромном оборудовании с учётом приватности. Для превращения этого подхода в стандарт безопасности на уровне города потребуются более широкие и длительные испытания, а также адаптация к другим типам зданий, но работа очерчивает ясный практический путь в этом направлении.

Цитирование: Wu, S., Yang, H., Hu, Y. et al. Interpretable and lightweight fall detection in a heritage gallery using YOLOv11-SEFA for edge deployment. Sci Rep 16, 7795 (2026). https://doi.org/10.1038/s41598-026-39527-y

Ключевые слова: обнаружение падений, умные галереи, edge AI, безопасность пожилых, компьютерное зрение