Clear Sky Science · zh

用于自主轮椅的优化实时定性基于HOG的视觉伺服系统

2026-02-24 · 返回目录

为最需要帮助的人提供更智能的出行

对于许多依赖电动轮椅的人来说，在拥挤的走廊或不平的人行道上操控方向既费力又令人紧张，甚至在没有帮助的情况下无法完成。本文提出了一种新方法，使轮椅通过小型摄像头“看见”周围环境，并在实时中平滑且安全地自主转向，即便使用廉价硬件也能实现。通过对视觉信息的处理和向运动转换方式进行精心重设计，作者展示了如何在微小、低功耗的计算机上运行智能轮椅导航，同时保持乘坐者的舒适与可控性。

为什么常规轮椅在现实环境中力不从心

传统电动轮椅通常由操纵杆直接驱动，或依赖简单的碰撞传感器来避开障碍物。这些方法在医院走廊、购物中心或城市人行道等拥挤且不断变化的空间中常常失效。用户反映他们最需要的是平滑、可预测的运动和在不同光照条件下的可靠性，而不是单纯的速度。同时，许多使用摄像头和复杂数学方法的高端机器人技术需要强大的计算机，这对日常轮椅来说既昂贵又笨重。这种用户需求与低成本硬件能力之间的差距正是该研究旨在填补的。

教轮椅读“模式”而不是点

该系统使用安装在轮椅上的摄像头观察前方场景，并不是将其表示为单个点或地标，而是用称为梯度直方图的边缘和线条模式来描述。简单来说，它观察图像中亮度如何变化，并将其凝练为场景的紧凑指纹。这类模式描述天然对光照变化和部分遮挡具有容忍性，例如行人短暂经过摄像头视野。轮椅将当前模式与对应期望视图的“目标”模式（例如直走的走廊外观或路径尽头的标志）进行比较，然后调整运动使两者更接近匹配。

为更安全控制留出缓冲空间

该方法并不要求当前视图与目标视图完美一致，而是引入了一个灵活的“置信区”。当轮椅的摄像头视图足够接近目标时，控制系统会刻意放松，避免来回颤动式的修正。这是通过一个数学激活函数实现的，该函数根据视觉误差的大小逐步增减转向响应，而不是在有任何误差时就一味加力。因此，轮椅可以在部分遮挡和视觉不确定性下避免突然的抖动，在走廊循迹或朝一系列视觉目标移动等任务中保持平滑轨迹。

让先进视觉在小型计算机上可行

一个主要挑战是这些丰富的视觉指纹通常计算代价高。作者通过重写计算方式来应对：使用高效的“整体一次性”运算替代缓慢的嵌套循环、削减不必要的精度并细致组织内存使用。在经常用于业余项目的树莓派（信用卡大小的计算机）上，改进的软件将处理速度从不可用的水平（大约每12秒一帧）提升到大约每秒五点五帧。轮椅的电机以更快且稳定的频率接收指令，因此车轮在摄像头和视觉系统在后台更新时也能平稳移动。为适应实际辅助使用，还内置了额外的安全层，包括硬件制动和在指令停止到达时中断轮椅的看门狗机制。

从实验室理论走向日常帮助

通过在走廊、人行道和受控视频测试中的实验，该系统持续地将轮椅从一个视觉目标引导到下一个，并在接近每个目标时逐步减少转向修正。摄像头的模式匹配误差稳步缩小，证明轮椅在不丢失重要特征的情况下正视觉对准自己。简言之，研究表明一台小型、平价的计算机和一台简单摄像头就足以为电动轮椅提供一个稳健的、基于摄像头的“自动驾驶”功能，同时兼顾舒适和安全。这为面向行动不便者的更易获取的基于摄像头的导航辅助打开了大门，并为未来诸如更丰富的三维感知和更平滑的避障升级奠定了基础。

引用: Hafez, A.H.A. An optimized real-time qualitative HOG-based visual servoing system for autonomous wheelchair. Sci Rep 16, 8688 (2026). https://doi.org/10.1038/s41598-026-41566-4

关键词: 自主轮椅, 辅助机器人学, 计算机视觉, 视觉导航, 实时控制