Clear Sky Science · zh

一种基于轻量级 YOLOv8n 的人体异常姿态检测方法

2026-02-04 · 返回目录

为何识别异常体位很重要

跌倒、突发胸痛或有人在走廊晕倒常在几秒内发生，如果周围无人，救援可能来不及。本文提出了一种紧凑的人工智能系统，能够实时监视来自监控或护理机构摄像头的普通视频，自动标注危险的异常姿态。研究者通过使软件既准确又轻量，旨在将可靠的跌倒与健康事件检测带到日常设备上，从医院监护到老人住所的低成本摄像头都能应用。

从普通摄像头到更智能的监护

现代监控系统已经使用计算机视觉检测并跟踪人体运动，但异常姿态尤为难以识别。人站立、捂胸、呕吐或躺在地上的样子差别很大，这类事件短促、多样，且常被家具遮挡或受光线影响。现有算法有时能达到较高精度，但往往笨重且速度慢，需要强大的硬件和精细调优。作者关注于在不牺牲可靠性的前提下，使检测既快速又节省计算资源，以便能在常见显卡甚至嵌入式设备上运行。

识别高风险姿态的更精简“大脑”

该工作的核心是对一种流行目标检测模型 YOLOv8n 的改进版本。研究者构建了一个更轻、更专注的变体，称为 PSD‑YOLOv8n。首先他们加入了一个名为 PoseMSA 的新注意力模块，帮助网络聚焦人体最具信息量的部分，同时忽略杂乱背景。该模块通过模拟横向观察图像和穿越不同特征层的操作，以简洁的计算方式提升与姿态有关的信号，同时保持较低的计算量。其次，他们重新设计了模型“放大细节”的方式，提出了 KA‑Sample 上采样模块，能学会在关键体点周围（如头部、躯干和四肢）锐化区域，使扭曲或塌陷的姿态更清晰可辨。

更精确的框与更明确的判定

鉴于异常姿态常与背景交融——比如有人半蜷在桌下——作者还改造了最后的决策阶段，即检测头。他们的 Detect‑PSA 模块融合了多尺度信息，并采用一种基于概率的边界框绘制方式。系统不再仅猜测一条硬性边缘来界定人体，而是将框的每一侧表示为可能位置的小分布并求平均。这一方法在四肢出现透视缩短、遮挡或沿地面延伸时，使轮廓更稳定，在复杂场景中得到更接近人工标注的框。

将系统付诸测试

为评估设计的实际效果，团队构建了专门的数据集 SSHDataset，来自多角度室内视频，包含四种状态的人体图像：正常、胸痛、呕吐与跌倒。经人工精标与数据增强后，他们在相同设置下训练了 PSD‑YOLOv8n 与一系列竞品模型。在标准准确性度量上，他们的方法在常见的重叠阈值下达到了 97.8% 的检测得分，在更严格标准下仍保持良好表现。与此同时，该模型仅使用约两百万参数和 4.5 兆字节的权重文件——参数量约比原始 YOLOv8n 少三分之一，计算量也降低超过三分之一——并能以超过 80 帧每秒的速度运行。在独立的公开跌倒检测数据集上的测试表明，这些性能提升能迁移到新数据，尤其在实际跌倒检测上有显著改善。

对日常安全的意义

简而言之，该研究提出了一个紧凑的数字“救生员”，能实时监看视频并可靠地识别出人体姿态中表明危险的信号。通过重构模型关注人体区域的方式、重建细节与绘制人体边框，作者达成了高精度、快速与小体量的罕见组合。此类系统可被嵌入医院监护设备、智能家居中枢或公共场所摄像头，用于在杂乱房间和各种光照下及时触发跌倒或突发危急的警报。随着该方法在更长时间序列与更多环境中的进一步改进与扩展，它可能成为新一代隐形、全天候守护者的基础，帮助在无需持续人工监视的情况下保护易受伤害的人群更安全。

引用: Li, G., Zhang, J., Ji, Q. et al. A lightweight YOLOv8n-based method for human abnormal posture detection. Sci Rep 16, 7222 (2026). https://doi.org/10.1038/s41598-026-37903-2

关键词: 跌倒检测, 人体姿态, 计算机视觉, 轻量化人工智能, 老年护理