Clear Sky Science · ja

記憶支援型深層強化学習を用いた社会的配慮のある自律ロボットのナビゲーション

· 一覧に戻る

群衆の中を礼儀正しく移動できるロボット

混雑した商業施設や病院の廊下を、人にぶつからず、周囲の人の流れを妨げず、不自然な振る舞いをせずにすり抜ける配達ロボットを想像してみてください。本論文は、衝突を避けるだけでなく、周囲の人々にとって自然で快適に感じられる振る舞いをする、新しい群衆通行手法を提示します。

人の間を移動することがなぜ難しいのか

ロボットにとって、床のラインに沿って移動することよりも群衆の中を歩くことの方が遥かに難しいのは明白です。人は突然速度を変えたり、グループで動いたり、立ち止まってスマートフォンを見たりします。従来のナビゲーション手法はしばしば人を単純な移動する障害物とみなし、瞬間的に見えている情報にだけ反応します。その結果、場面が複雑になると過度に慎重になってその場で停止してしまったり、逆に大胆すぎてグループの間を無理に突っ切り、不安や無礼さを感じさせたりします。著者らは、実用的なサービスロボットには周囲への注意、個人空間への配慮、そして迅速で知的な意思決定の組み合わせが不可欠だと主張します。

Figure 1
Figure 1.

人々の最近の動きを記憶するロボット

研究チームはARSAと呼ばれる新しいナビゲーション手法を導入しました。これはロボットが近くの人々の直近の「記憶」を利用できるようにするものです。人々の現在位置だけを見るのではなく、彼らがどこにいたか、どのように動いてきたかの短い履歴を考慮します。この履歴は系列データの処理に優れた特殊なニューラルネットワークで処理され、ロボットは時間を通じた群衆の動きの内部像を形成します。簡単に言えば、ロボットは誰かが左に進路を寄せ始める、あるいはグループが集まり始めるといったパターンを検出し、問題が起きる前に経路を調整することを学びます。

動的な安全バブルで人々に余裕を与える

人々の快適さを保つために、ARSAは各人の周りに「警告ゾーン」── 歩行速度や体格に応じてサイズが変化する移動する安全バブル── を設けます。ロボットがこれらのゾーンに近づきすぎると、学習過程で穏やかなペナルティを受け、狭い隙間を突っ切るのではなく周囲を回避するように教えられます。システムはまた、スポットライトのようにロボットの意思決定をその時々で最も重要な少数の人に集中させる注意機構を使います。例えば、遠くの人よりも進路上にいる人に注目する、といった働きです。これらの仕組みを組み合わせることで、より滑らかで人に配慮した経路選択が可能になります。

新手法の実証

著者らはARSAを、最大20人の移動する人と追加の障害物がいる数千のシミュレーション群衆状況で試験しました。複数の最新学習手法を用いる主要なナビゲーション法と比較したところ、ARSAは目標達成率が高く、衝突は少なく、特に他の手法がためらったり停止したりするような狭く混雑した場面でより速くルートを完了しました。次に、レーザースキャナを搭載した移動ロボットを使い、数名の人や別のロボットがいる屋内環境で実世界テストも行いました。再学習なしで、ARSAは不規則な人の動きや意図的な阻止行動にも安全に対応し、全ての走行で一度も衝突を起こしませんでした。

Figure 2
Figure 2.

日常のロボットにとっての意義

一般の読者にとっての要点は、この研究が歩行空間を私たちと共有しても邪魔にならないロボットに近づけるということです。人々の最近の動きを記憶し、次の一歩を予測し、柔軟な個人空間ゾーンを尊重することで、ARSAはロボットを硬直した機械ではなく思いやりのある歩行者のように動かす助けになります。著者らは将来の課題として限られたセンサーやより複雑な建物への対応を挙げていますが、彼らの結果は記憶と注意に基づくナビゲーションが商業施設、病院、キャンパスなどで安全で信頼できるサービスロボットの重要な要素になり得ることを示唆しています。

引用: Montero, E., Pico, N., Alvarez-Alvarado, M.S. et al. Autonomous robots with socially-aware navigation using memory-assisted deep reinforcement learning. Sci Rep 16, 13214 (2026). https://doi.org/10.1038/s41598-026-42026-9

キーワード: ソーシャルロボットのナビゲーション, 群衆に配慮するロボット, 深層強化学習, 人間とロボットの相互作用, 自律移動ロボット