Clear Sky Science · zh

在文化遗产画廊中使用 YOLOv11-SEFA 在边缘部署的可解释轻量级跌倒检测

2026-02-08 · 返回目录

为什么画廊安全重要

随着社会老龄化，越来越多的老年人参观博物馆与文化遗产画廊——这些优美的空间并非为现代安全监控而设计。在此类环境中一次简单的跌倒可能导致严重伤害，但在建筑内布设新传感器或持续监视摄像头既昂贵又具侵扰性，且常常不切实际。本文探讨了一种在此类场所快速自动检测跌倒的新方法：使用可在靠近摄像头处运行的紧凑型人工智能，从而避免大量视频传输到互联网并保护访客隐私。

一个难以监控的场所

位于北悉尼的 Rochfort 画廊是项工作的测试场地——这是一栋修复过的 1920 年代建筑，拥有高天花板、华丽装饰、光亮地面和玻璃展柜。这些特征让参观者获得丰富的视觉体验，但对机器而言却是难题：光线在玻璃上反射，阴影随时间变化，人群来去匆匆。文物保护规则也限制钻孔、布线和笨重设备。作者认为，任何在此处部署的跌倒检测系统都必须体积小、能效高并尊重隐私，同时足够可靠以帮助工作人员保护易受伤害的访客。

教会计算机什么是跌倒

为训练系统，团队并未依赖少量的模拟数据集，而是扩展了现有的图像集合，加入了数千张在博物馆、画廊和社区中心拍摄的照片。每张图像被标注为正常姿态（如站立或行走）或跌倒姿态（以不同方向躺在地面），并从多种视角拍摄——天花板挂装、侧面和视线高度——涵盖从日光到昏暗、聚光的室内环境。他们还特意包含了被家具或其他访客部分遮挡的场景以及拥挤房间，以反映真实公共空间的杂乱与复杂性。

边缘的轻量级智能监视器

系统的核心是一种名为 YOLOv11-SEFA 的精简目标检测网络，它分析每帧摄像头画面并判断是否有人跌倒。作者没有构建更重或更复杂的模型，而是在一个现有的快速检测器上增加两项针对性改进，使其对小型或部分被遮挡的身体以及与地面接触的区域给予特别关注。这既提高了对真实跌倒的召回率，也提升了边界框定位精度，同时将计算开销控制在可在建筑中安装的中等“边缘”计算机上运行的水平。与几种流行替代方法的对比测试显示，该调优模型在准确性与速度之间达成了良好折衷，相较于原始模型仅增加了很小的处理负担。

从简单警报到分级风险

系统不只是简单地报告“跌倒”或“未跌倒”，而是进一步为每个检测事件分配 0 到 3 的风险等级。为此，它将视觉检测转化为六个简单数值：人体在图像中占比、身体倾斜程度、与摄像头的相对距离、轮廓的拉伸或压扁程度、周围区域的视觉复杂度，以及场景中其他人的数量。一个受专家安全意见启发的独立决策模型将这些值合成为四个等级：正常活动、低风险异常姿态、中高风险和明显高风险的跌倒。重要的是，作者使用了可解释性工具确认模型确实主要依赖姿态相关线索，如身体倾斜和形状，而不是无关的背景细节。

在真实画廊中的测试

完整系统将摄像头、本地边缘计算机和云服务连接成一个四层流水线。摄像头将降帧率的视频流传到同一楼层的紧凑机器，这些机器运行跌倒检测器并生成警报；仅在必要时将短视频片段或热力图覆盖发送到云端，从而限制带宽使用并降低隐私暴露。在 Rochfort 画廊为期 72 小时的试点中，系统在拥挤场景下仍能保持约 0.25 秒的响应时间，并在高峰期每小时产生的虚惊少于 0.5 次——大多来自蹲下拍照的访客——同时所有模拟跌倒均被检测到。作者强调这些数据来自相对短暂且受控的试验，但表明该方法在要求严格的现实场景中技术上是可行的。

这对未来公共空间的意义

对非专业读者而言，关键结论是：现在可以在历史画廊和类似公共建筑的现有摄像系统上，添加一种自动且分级的跌倒警示层，而无需大规模改造或持续人工监控。通过在现场小型计算机上运行高效检测器并谨慎构建结果的解释与共享方式，系统初步证明技术可以在背景中静默守望——识别可能的跌倒、提示其严重程度，并以适度硬件与注重隐私的方式实现。要将其发展为城市级安全标准，还需更广泛和更长时间的试验以及对其他类型建筑的拓展，但这项工作为实现这一目标绘制了清晰可行的路径。

引用: Wu, S., Yang, H., Hu, Y. et al. Interpretable and lightweight fall detection in a heritage gallery using YOLOv11-SEFA for edge deployment. Sci Rep 16, 7795 (2026). https://doi.org/10.1038/s41598-026-39527-y

关键词: 跌倒检测, 智能画廊, 边缘人工智能, 老年人安全, 计算机视觉