Clear Sky Science · zh
使用记忆辅助深度强化学习进行社交感知导航的自主机器人
能够礼貌穿行人群的机器人
想象一下送货机器人在繁忙的购物中心或医院走廊中穿行,而不会碰到任何人、阻碍他人或表现得古怪。本文提出了一种新的机器人群体穿行方法,不仅能避免碰撞,还能以让周围人感觉自然、舒适的方式行进。
为什么在人群中移动如此困难
对于机器人来说,穿行人群比沿地面画线行走困难得多。人会突然改变速度、成群结队或停下来查看手机。传统导航方法常把人当作简单的移动障碍,仅对机器人在某一时刻看到的情况做出反应。这可能导致机器人过于谨慎,在场景变得复杂时停在原地,或过于冒进,从人群中穿插而显得不安全或不礼貌。作者认为,成功的服务机器人必须结合对周围环境的感知、对人际空间的敏感以及快速、智能的决策能力。

会记住人们刚刚动作的机器人
研究团队提出了 ARSA,一种让机器人利用附近人群短期“记忆”来导航的新方法。ARSA 不只关注人的当前位置,还考虑他们过去短时间内的位置和运动轨迹。这段历史由一种擅长处理序列的特殊神经网络处理,使机器人能够在时间上构建人群运动的内部图景。简单来说,机器人学会识别模式,例如有人开始向左偏或群体开始聚拢,并在问题出现前调整路径。
用移动的安全气泡给人留出空间
为让人们感到舒适,ARSA 在每个人周围设定了一个“警示区”——一个会随行走速度和体型变化的移动安全气泡。当机器人接近这些区域时,会在学习过程中受到温和的惩罚,从而教会它绕开人而不是穿过狭窄空隙。系统还使用了一种注意力机制,像聚光灯一样把机器人决策的焦点放在每一时刻最关键的少数人上——例如直接挡在路径上的人,而不是远处的人。结合起来,这些设计帮助机器人选择更平滑、更符合人类期望的路径。
将新方法付诸测试
作者在数千个模拟人群场景中测试了 ARSA,场景中最多有二十名移动人员及额外障碍物。他们将其与几种同样使用现代学习技术的领先导航方法进行了比较。ARSA 更经常完成任务、碰撞更少、完成路径更快,尤其是在其他方法犹豫或停滞的紧凑繁忙场景中更为明显。团队随后在室内环境中使用配备激光扫描仪的移动机器人进行了真实世界测试,场景中有人数人甚至另一台机器人。未经再训练,ARSA 引导机器人安全穿过不规则的人类动作和偶尔的故意阻挡,所有运行均无一次碰撞。

这对日常机器人意味着什么
对普通读者而言,核心信息是这项工作使我们更接近能够与人类共享步道且不妨碍他人的机器人。通过记忆人们的移动、预测他们的下一步并尊重灵活的人际空间,ARSA 帮助机器人更像体贴的行人而非僵硬的机器。尽管作者指出未来工作需要更好地应对传感器有限性和更复杂的建筑环境,但他们的结果表明,基于记忆和注意力的导航有望成为购物中心、医院、校园等场所安全且可信赖的服务机器人的核心要素。
引用: Montero, E., Pico, N., Alvarez-Alvarado, M.S. et al. Autonomous robots with socially-aware navigation using memory-assisted deep reinforcement learning. Sci Rep 16, 13214 (2026). https://doi.org/10.1038/s41598-026-42026-9
关键词: 社交机器人导航, 群体感知机器人, 深度强化学习, 人机交互, 自主移动机器人