Clear Sky Science · ru

Автономные роботы с социально-осознанной навигацией с использованием глубокого обучения с подкреплением и памяти

· Назад к списку

Роботы, которые вежливо передвигаются среди людей

Представьте себе доставочных роботов, скользящих по оживленному торговому центру или больничному коридору, не сталкиваясь с людьми, не замедляя их и не действуя странно. В этой статье представлен новый подход к передвижению роботов в толпе, который не только предотвращает столкновения, но и ведет себя так, чтобы окружающим было комфортно и естественно.

Почему движение среди людей так сложно

Для робота продвижение через толпу намного сложнее, чем следование по нарисованной на полу линии. Люди внезапно меняют скорость, идут группами или останавливаются, чтобы проверить телефон. Традиционные методы навигации часто рассматривают людей как простые движущиеся препятствия и реагируют только на то, что робот видит в данный момент. Это может сделать робота излишне осторожным — он останавливается, когда сцена становится слишком сложной, — или слишком дерзким, прорезая группы людей так, что это кажется небезопасным или невежливым. Авторы утверждают, что успешный сервисный робот должен сочетать осведомленность о окружении, уважение к личному пространству людей и быстрое, разумное принятие решений.

Figure 1
Figure 1.

Робот, который помнит, как люди только что двигались

Исследовательская группа представляет ARSA — новый подход к навигации, который позволяет роботу использовать короткие «воспоминания» о том, как рядом находившиеся люди двигались. Вместо того чтобы смотреть только на текущие положения людей, ARSA учитывает короткую историю их перемещений. Эта история обрабатывается специальным типом нейронной сети, хорошо работающей с последовательностями, что позволяет роботу формировать внутреннюю картину движения толпы во времени. Проще говоря, робот учится замечать закономерности — например, кто-то начинает смещаться влево или группа начинает скапливаться — и корректирует маршрут до того, как возникнут проблемы.

Предоставление пространства с помогающими безопасностью «пузырями»

Чтобы людям было комфортно, ARSA окружает каждого человека «зоной предупреждения» — подвижным защитным пузырем, размер которого меняется в зависимости от скорости ходьбы и телосложения. Когда робот подходит слишком близко к одной из таких зон, он мягко наказывается в процессе обучения, что учит его огибать людей, а не протискиваться через узкие места. Система также использует механизм внимания, который действует как прожектор, фокусируя принятие решений робота на нескольких наиболее важных людях в каждый момент — например, на человеке прямо на его пути, а не на ком-то далеко. В совокупности эти идеи помогают роботу выбирать более плавные и удобные для людей траектории.

Испытания нового метода

Авторы проверили ARSA в тысячах смоделированных ситуаций с толпой, где присутствовало до двадцати движущихся людей и дополнительные препятствия. Они сравнили его с несколькими ведущими методами навигации, которые также используют современные методы обучения. ARSA достигал целей чаще, сталкивался реже и завершал маршруты быстрее, особенно в плотных и загруженных сценах, где другие методы колебались или застывали. Команда затем провела полевые испытания с мобильным роботом, оснащенным лазерным дальномерным сканером, в помещениях с несколькими людьми и даже другим роботом. Без дополнительного обучения ARSA безопасно проводил робота через нерегулярные человеческие движения и периодические намеренные блокировки, завершив все прогоны без единого столкновения.

Figure 2
Figure 2.

Что это значит для повседневных роботов

Для неспециалиста главный вывод в том, что эта работа приближает нас к роботам, которые могут делить с нами тротуары, не мешая. Запоминая, как люди двигались, предсказывая их следующие шаги и уважая гибкие зоны личного пространства, ARSA помогает роботам передвигаться скорее как внимательные пешеходы, чем как жесткие машины. Хотя авторы отмечают, что в будущем нужно лучше справляться с ограниченными сенсорами и более сложными планировками зданий, их результаты говорят о том, что навигация на основе памяти и внимания может стать ключевым компонентом безопасных и заслуживающих доверия сервисных роботов в торговых центрах, больницах, кампусах и за их пределами.

Цитирование: Montero, E., Pico, N., Alvarez-Alvarado, M.S. et al. Autonomous robots with socially-aware navigation using memory-assisted deep reinforcement learning. Sci Rep 16, 13214 (2026). https://doi.org/10.1038/s41598-026-42026-9

Ключевые слова: навигация социальных роботов, роботы, учитывающие толпу, глубокое обучение с подкреплением, взаимодействие человек–робот, автономные мобильные роботы