Clear Sky Science · zh

POP-YOLOv8:一种用于夜间交通环境中部分遮挡行人的目标检测框架

· 返回目录

为什么在黑暗中看清行人很重要

夜间驾驶比白天危险得多,主要因为更难看清路上或路边的人。车灯会产生眩光和深重的阴影,行人也可能部分被停放的车辆或街道设施遮挡。本文介绍了POP-YOLOv8,一种计算机视觉系统,旨在帮助车辆更快、更准确地识别黑暗且繁忙街道中部分被遮挡的行人,从而有可能减少夜间事故。

夜间街道的隐蔽危险

夜间交通场景视觉上很混乱。路灯、车灯、雨和雾都会降低图像质量,使人容易融入背景。常规的行人检测算法常常漏检那些距离较远、光照较差或被其他物体部分遮挡的人。作者关注一个尤其危险的情况:在低光照下仅部分可见的行人,比如从停放车辆后面探出身的人。他们认为,有用的安全系统必须既准确,又足够快速以在车载计算机上实时运行。

Figure 1
Figure 1.

更聪明的发现行人方式

POP-YOLOv8建立在一种流行且快速的检测器YOLOv8n之上,并对夜间驾驶的挑战进行了适配。首先,特征增强模块通过在多个尺度上观察场景来强化微弱的部分遮挡行人线索,同时保持计算量在可控范围内。接着,一个专用的注意力模块——部分遮挡行人注意力模块(Partial Occlusion Pedestrian Attention Module)教会网络关注图像中最相关的部分,例如可见的肩膀或腿部,同时弱化路面标线或商铺招牌等干扰。两者结合有助于系统在行人仅部分可见时仍能持续跟踪他们。

更轻、更快、更亮

为了在实际车辆中可用,模型不仅要具备良好的感知能力,还要能在受限硬件上快速运行。因此,研究者用“Ghost”模块替换了一些计算代价高的操作,利用更廉价的运算生成有用特征,减少冗余计算。同时,他们也从根本上处理黑暗问题:基于自校正照明网络的亮度增强组件在检测前清理并提亮相机输入图像,采用全精度与半精度混合计算以在图像质量与速度间取得平衡。诸如高效通道注意力和残差连接等额外设计有助于保留诸如行人轮廓等细节,同时保持处理流程的稳定性。

对系统的检验

团队在包含数千个具有多样天气与光照条件的夜间场景的大型驾驶数据集BDD100K上训练并评估POP-YOLOv8。他们进行了细致的“消融”测试,逐步加入每个新模块以评估其贡献。特征增强和注意力模块各自提高了检测精度,尤其是对部分遮挡行人,但最初也使模型变慢。随后引入的基于Ghost的模块则在恢复速度的同时进一步提升了精度。与包括Faster R-CNN和后续YOLO版本在内的若干知名检测器比较,POP-YOLOv8在夜间场景中实现了更好的精度与帧率平衡,且在对图像进行适度亮度增强后的表现尤为出色。

Figure 2
Figure 2.

这对夜间安全意味着什么

对非专业读者来说,结论很直接:POP-YOLOv8是一种经过调优的视觉系统,可在黑暗且杂乱的街道中更可靠地帮助车辆“看见”行人,即使这些行人部分被遮挡。通过结合亮度校正、对重要图像区域的选择性关注以及更高效的内部结构,该模型比若干主流替代方案对行人的检测更准确,同时仍足够快以支持实时使用。尽管仍需进一步工作以降低其在小型设备上的计算成本,但像POP-YOLOv8这样的系统使自动驾驶在识别最脆弱道路使用者方面更进一步——尤其是在夜间光线不足的道路上。

引用: Liu, H., Zhang, Z. & Feng, B. POP-YOLOv8: an object detection framework for partially occluded pedestrians in nighttime traffic environments. Sci Rep 16, 4841 (2026). https://doi.org/10.1038/s41598-026-35146-9

关键词: 夜间行人检测, 自动驾驶安全, 目标检测, 低光照图像增强, 计算机视觉