Clear Sky Science · pt
Um algoritmo de escalonamento por aprendizado por reforço multiagente integrando modelagem estrutural de grafo de estado e grafo de tarefas para despacho em ride-sharing
Por que um ride-sharing mais inteligente importa para a vida na cidade
Quem já esperou tempo demais por um carro de aplicativo, ou viu veículos vazios passarem por esquinas movimentadas, sabe como é difícil coordenar o transporte urbano em tempo real. Este estudo apresenta um novo sistema de despacho baseado em IA projetado para parear passageiros e veículos de compartilhamento de forma mais rápida e eficiente, reduzindo quilometragem desperdiçada e encurtando tempos de espera em tráfego urbano denso e em rápida mudança.
De pareamentos simples ao tráfego urbano emaranhado
O ride-hailing começou com uma ideia simples: um motorista, um passageiro, uma viagem. As ruas das cidades de hoje parecem muito diferentes. As plataformas gerenciam milhares de veículos e passageiros simultaneamente, frequentemente agrupando vários passageiros no mesmo carro e roteando frotas por bairros inteiros. A demanda é desigual — o centro pode estar inundado de solicitações enquanto outra área fica tranquila — e tudo muda minuto a minuto. Regras de despacho tradicionais ou estratégias simples de “carro mais próximo” têm dificuldade nesse cenário, levando a longas esperas, baixa utilização dos veículos e desvios desnecessários. A Figura 
Dois mapas conectados em vez de um grande borrão
Os autores propõem um novo framework chamado DualG-MARL que trata o problema de despacho como dois mapas sobrepostos. Um mapa descreve os veículos: onde estão, quantos assentos têm e se estão livres ou já transportando passageiros. O outro mapa descreve as solicitações de corrida: quem quer viajar, de onde, para onde e em que horário. Cada mapa é modelado como um grafo, onde pontos representam carros ou pedidos e arestas conectam aqueles que estão próximos no espaço e no tempo. Ao manter as informações de veículos e passageiros em grafos separados mas interligados, o sistema preserva a estrutura de cada lado em vez de misturar tudo em uma imagem única e confusa.
Como a IA aprende a parear passageiros e carros
Sobre esses grafos gêmeos, o sistema usa uma classe de métodos de aprendizado de máquina conhecida como aprendizado por reforço multiagente. Cada veículo é tratado como um tomador de decisões independente, ou “agente”, que escolhe entre solicitações próximas. Os agentes compartilham um objetivo comum: reduzir tempos de espera, evitar desvios excessivos e manter os carros ocupados de forma produtiva. O modelo varre ambos os grafos para extrair padrões e então usa um mecanismo de atenção — uma ferramenta de IA que destaca as conexões mais relevantes — para ligar carros e passageiros adequados através dos dois mapas. Para manter as decisões rápidas e estáveis, ele não considera todos os pares possíveis. Em vez disso, constrói uma lista curta com os principais candidatos para cada veículo (o conjunto Top-K), filtrada por regras rígidas como capacidade de assentos, atraso aceitável para coleta e comprimento de desvio permitido. Um aprendiz centralizado avalia o desempenho de toda a frota, enquanto os carros individuais seguem regras locais simples durante a operação em tempo real. A Figura 
Testando o sistema em viagens reais de Nova York
Os pesquisadores testaram o DualG-MARL em dados de viagens em larga escala da Taxi and Limousine Commission de Nova York, com foco em Manhattan e Queens. Eles compararam seu método com uma variedade de abordagens existentes, incluindo regras feitas à mão, otimização matemática e despachantes avançados baseados em aprendizado, como o CoopRide. Em ambos os distritos, o novo sistema estabeleceu novos patamares em quatro medidas-chave: reduziu o tempo médio que os passageiros aguardavam para o embarque, aumentou a fração de solicitações de corrida atendidas com sucesso, elevou a proporção do tempo em que os veículos transportavam clientes e reduziu ligeiramente a distância extra causada pelo compartilhamento. Importante, esses ganhos vieram sem explodir os custos computacionais: ao limitar a atenção a um conjunto selecionado de pareamentos promissores, o método permaneceu rápido o suficiente para uso em tempo real.
O que isso significa para passageiros e cidades no dia a dia
Em termos práticos, o estudo mostra que representar o sistema de ride-hailing de uma cidade como duas redes estruturadas — uma para veículos e outra para passageiros — e permitir que elas interajam por meio de um processo de aprendizado cuidadosamente projetado pode deixar o pooling mais inteligente e mais responsivo. Para os passageiros, isso significa esperas mais curtas e embarques mais confiáveis; para motoristas e plataformas, significa melhor aproveitamento dos veículos e menos deslocamentos vazios; e para as cidades, sugere um futuro em que as vias existentes podem transportar mais pessoas com menos carros e menos congestionamento. Os autores sugerem que ideias semelhantes, baseadas em grafos e multiagente, poderiam eventualmente ser estendidas a outros serviços, de frotas de táxis autônomos a resposta a emergências, oferecendo uma maneira mais ordenada de gerenciar os fluxos complexos e variáveis da vida urbana moderna.
Citação: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8
Palavras-chave: despacho de ride-sharing, aprendizado por reforço multiagente, redes neurais em grafos, mobilidade urbana, casamento dinâmico