Clear Sky Science · pt

Robôs autônomos com navegação socialmente consciente usando aprendizado profundo por reforço assistido por memória

· Voltar ao índice

Robôs que podem se mover educadamente em multidões

Imagine robôs de entrega deslizando por um shopping movimentado ou por um corredor de hospital sem esbarrar em ninguém, atrapalhar o fluxo de pessoas ou agir de forma estranha. Este artigo apresenta uma nova forma de os robôs atravessarem multidões que não só evita colisões, como também se comporta de maneira que soa natural e confortável para as pessoas ao redor.

Por que se movimentar entre pessoas é tão difícil

Para um robô, caminhar por uma multidão é muito mais difícil do que seguir uma linha pintada no chão. Pessoas mudam de velocidade de repente, caminham em grupos ou param para olhar o celular. Métodos tradicionais de navegação muitas vezes tratam as pessoas como obstáculos móveis simples e reagem apenas ao que o robô vê num dado instante. Isso pode tornar o robô excessivamente cauteloso, fazendo-o parar quando a cena fica complexa, ou excessivamente ousado, cortando grupos de um jeito que parece inseguro ou indelicado. Os autores argumentam que um robô de serviço bem-sucedido deve combinar percepção do entorno, sensibilidade ao espaço pessoal das pessoas e tomada de decisão rápida e inteligente.

Figure 1
Figure 1.

Um robô que lembra o que as pessoas acabaram de fazer

A equipe de pesquisa apresenta o ARSA, uma nova abordagem de navegação que permite ao robô usar “memórias” curtas de como as pessoas próximas têm se movimentado. Em vez de olhar apenas para as posições atuais, o ARSA considera um histórico curto de onde elas estavam e como se moveram. Esse histórico é processado por um tipo especial de rede neural que se destaca no tratamento de sequências, permitindo ao robô formar uma imagem interna do movimento da multidão ao longo do tempo. Em termos simples, o robô aprende a identificar padrões, como alguém começando a desviar para a esquerda ou um grupo começando a se agrupar, e ajusta sua rota antes que os problemas surjam.

Dando espaço às pessoas com bolhas móveis de segurança

Para manter as pessoas confortáveis, o ARSA envolve cada pessoa com uma “zona de aviso” — uma bolha de segurança móvel que muda de tamanho dependendo da velocidade de caminhada e do porte corporal. Quando o robô chega muito perto de uma dessas zonas, é suavemente punido durante seu processo de aprendizado, ensinando-o a contornar as pessoas em vez de cortar espaços apertados. O sistema também usa um mecanismo de atenção, que funciona como um holofote, para concentrar a tomada de decisão do robô nas poucas pessoas que mais importam em cada momento — por exemplo, a pessoa diretamente em seu caminho em vez de alguém distante. Juntas, essas ideias ajudam o robô a escolher trajetos mais suaves e mais favoráveis aos humanos.

Testando o novo método

Os autores submeteram o ARSA a milhares de situações simuladas de multidões, com até vinte pessoas em movimento e obstáculos adicionais. Compararam-no com vários métodos de navegação líderes que também usam técnicas modernas de aprendizado. O ARSA alcançou seus objetivos com mais frequência, colidiu com menos frequência e completou suas rotas mais rapidamente, especialmente em cenas estreitas e movimentadas onde outros métodos hesitaram ou travaram. A equipe então realizou testes no mundo real usando um robô móvel equipado com um scanner a laser em ambientes internos com várias pessoas e até outro robô. Sem re-treinamento, o ARSA guiou o robô com segurança através de movimentos humanos irregulares e bloqueios deliberados ocasionais, completando todas as execuções sem uma única colisão.

Figure 2
Figure 2.

O que isso significa para robôs do dia a dia

Para um leigo, a mensagem principal é que este trabalho nos aproxima de robôs que podem compartilhar nossas calçadas sem atrapalhar. Ao lembrar como as pessoas vinham se movendo, prever seus próximos passos e respeitar zonas flexíveis de espaço pessoal, o ARSA ajuda os robôs a se mover mais como pedestres atenciosos do que máquinas rígidas. Embora os autores ressaltem que trabalhos futuros precisam lidar melhor com sensores limitados e edifícios mais complexos, seus resultados sugerem que navegação baseada em memória e atenção pode se tornar um ingrediente central de robôs de serviço seguros e confiáveis em shoppings, hospitais, campi e além.

Citação: Montero, E., Pico, N., Alvarez-Alvarado, M.S. et al. Autonomous robots with socially-aware navigation using memory-assisted deep reinforcement learning. Sci Rep 16, 13214 (2026). https://doi.org/10.1038/s41598-026-42026-9

Palavras-chave: navegação social de robôs, robôs conscientes da multidão, aprendizado profundo por reforço, interação humano–robô, robôs móveis autônomos