Clear Sky Science · zh

用于个性化和针对性互动辅助的模型预测博弈控制

2026-02-24 · 返回目录

像优秀训练搭档的机器人

想象一下有这样一位训练伙伴或物理治疗师：总能准确把握什么时候帮你发力，什么时候让你稍微费点劲，以及你接下来计划多大力度移动。本文展示了如何赋予接触式机器人——例如康复或工厂中使用的外骨骼——类似的直觉。通过数学上“预测”人在未来一到两秒内的运动意图，机器人可以平顺地分担负荷、降低疲劳，并微妙地引导人们的动作与学习。

为什么与机器人共享用力很难

当机器人与人发生物理连接——帮助他们移动四肢或搬运重物时，双方不断施力并相互反馈。传统机器人控制器大多忽视人类的计划；它们只是追求诸如精度或节能等性能目标。这会导致机器人变得过于僵硬和专横，或过于被动且无用。真实的人类搭档表现得更好：他们感知对方的动作、适应对方的能力，并鼓励从放松到努力的不同行为。作者认为，要让机器人更接近这种互动，机器人必须明确建模人如何规划动作以及他们愿意投入多少努力。

从博弈论看人—机互动

研究者基于博弈论——研究战略互动的数学——将人和机器人视为共享同一任务的两个“玩家”。各自有不同目标：人希望以最小努力追踪期望运动，而机器人希望在帮助追踪的同时尽量减轻人的负担。重要的是，两者都被假定只向前看很短的时间，即约一到两秒的有限规划窗，反映了人类自然的动作规划方式。在这个时间窗内，团队推导出纳什均衡的紧凑公式：一种力量的平衡模式，其中任一方在对方不改变策略的情况下无法改善自身结果。该均衡定义了每一时刻各自应施加的力。

教机器人读懂人类意图

要让机器人参与这种“运动博弈”，它必须先推断出人对精度与努力之间的权衡强度——这是随人而异且会随时间改变的隐藏偏好。作者通过逆向博弈方法解决了这个问题。随着人动作的进行，传感器测量关节角度和产生的扭矩。控制器随后反复搜索一组最能解释近期运动与力历史的人类偏好。有了这些偏好，它便能预测人在接下来短时段内可能的行为，并计算机器人最优的辅助力。所有这些在帮助受试者用手跟踪移动目标的腕部外骨骼上实时运行。

人和机器人学会协同

团队在三项实验中对三十名健康成人测试了他们的控制器。第一项实验中，受试者被要求在主动跟踪目标与保持被动之间切换。控制器迅速调整其内部估计：在主动阶段上升，在放松时接近零。第二项实验中，参与者在有无机器人辅助的试次间交替。使用新控制器时，机器人减少了人的关节用力和肌电活动，同时提高了跟踪精度。经过重复试次，每个人的互动模式趋向稳定的个体“均衡”，人机力量之间的相关性增加——表明相互理解在增强。第三项实验中，研究者引入了一个单一的辅助旋钮——一个改变机器人试图多大程度上最小化人类努力的元参数。调整该旋钮能平滑地改变人们选择贡献的努力量，而不会降低任务表现。

用一个旋钮引导行为

该辅助元参数允许设计者用一个控制跨越一系列互动风格：从几乎不帮助、到均等分担努力，再到近乎完全支持、机器人主导而人可以放松。在中间设置下，人类倾向于与机器人最协调，各自承担大约一半的负荷。推断出的人类偏好模式在不同辅助水平下对每个人保持一致——除非机器人几乎承担了一切，此时人们基本停止参与，行为变得更趋一致。这表明机器人既能发现个体控制风格，也能温和地推动它们，例如在训练的一个阶段要求用户更多参与，在另一个阶段减少参与。

这对康复与工作意味着什么

对非专业读者而言，核心信息是该控制器使机器人更像聪明的伙伴而非僵硬的机器。通过预测我们的动作意图并调整辅助力度，机器人可以在需要时减少我们的负担，在有益时鼓励我们更努力，并保持动作的精确与稳定。相同的数学框架可用于康复——逐步将努力从机器人转移到患者——或用于协作制造，让人和机器人安全高效地分担负荷。本质上，研究显示人会自然而然地适应于“与他们玩同一场博弈”的机器人，从而为更个性化、针对性的互动辅助打开了大门。

引用: Hafs, A., Farr, A., Verdel, D. et al. Model predictive game control for personalized and targeted interactive assistance. Commun Eng 5, 57 (2026). https://doi.org/10.1038/s44172-026-00605-8

关键词: 人机交互, 外骨骼辅助, 博弈论控制, 运动康复, 共享控制