Clear Sky Science · es

Un algoritmo de programación por aprendizaje por refuerzo multiagente que integra el modelado estructural de grafo de estado y grafo de tareas para el despacho en ridesharing

2026-01-17 · Volver al índice

Por qué un ridesharing más inteligente importa para la vida urbana

Cualquiera que haya esperado demasiado por un coche de plataforma o haya visto vehículos vacíos pasar por esquinas atestadas sabe lo difícil que es coordinar el transporte urbano en tiempo real. Este estudio presenta un nuevo sistema de despacho basado en IA diseñado para emparejar pasajeros y vehículos compartidos de forma más rápida y eficiente, reduciendo los kilómetros recorridos en vacío y acortando los tiempos de espera en tráfico denso y cambiante.

De emparejamientos simples al enredo del tráfico urbano

El servicio de ridesharing empezó con una idea sencilla: un conductor, un pasajero, un viaje. Las calles actuales se ven muy diferentes. Las plataformas gestionan miles de vehículos y usuarios a la vez, a menudo agrupando a varios pasajeros en el mismo coche y enrutando flotas por barrios enteros. La demanda es desigual: el centro puede estar inundado de solicitudes mientras otra zona está tranquila, y todo cambia minuto a minuto. Las normas de despacho tradicionales o las estrategias simples de «coche más cercano» chocan con este escenario, provocando largas esperas, baja utilización de los coches y desvíos innecesarios. La figura

ilustra cómo estos sistemas deben evolucionar de emparejamientos uno a uno sencillos a relaciones complejas de compartición muchos a muchos.

Dos mapas conectados en vez de una gran mancha

Los autores proponen un nuevo marco llamado DualG-MARL que trata el problema de despacho como dos mapas superpuestos. Un mapa describe los vehículos: dónde están, cuántos asientos tienen y si están libres o ya transportando pasajeros. El otro mapa describe las solicitudes de viaje: quién quiere desplazarse, desde dónde, hasta dónde y en qué momento. Cada mapa se modela como un grafo, donde los nodos representan coches o solicitudes y las aristas conectan aquellos que están próximos en espacio y tiempo. Al mantener la información de vehículos y pasajeros en grafos separados pero enlazados, el sistema conserva la estructura de cada lado en lugar de mezclar todo en una sola imagen confusa.

Cómo la IA aprende a emparejar pasajeros y coches

Sobre estos grafos gemelos, el sistema emplea una clase de métodos de aprendizaje automático conocida como aprendizaje por refuerzo multiagente. Cada vehículo se trata como un tomador de decisiones independiente, o «agente», que elige entre las solicitudes cercanas. Los agentes comparten un objetivo común: reducir los tiempos de espera, evitar desvíos excesivos y mantener los coches ocupados productivamente. El modelo explora ambos grafos para extraer patrones y luego utiliza un mecanismo de atención —una herramienta de IA que resalta las conexiones más relevantes— para vincular coches y pasajeros adecuados a través de los dos mapas. Para mantener las decisiones rápidas y estables, no considera cada par posible. En su lugar construye una lista reducida de los mejores candidatos para cada vehículo (el conjunto Top-K), filtrada por reglas estrictas como la capacidad de asientos, el retraso aceptable de recogida y la longitud de desvío tolerable. Un aprendizaje centralizado evalúa el rendimiento de toda la flota, mientras que los coches individuales siguen reglas locales sencillas durante la operación en tiempo real. La figura

muestra este flujo desde los grafos de vehículo y tarea a través del módulo de emparejamiento hasta las asignaciones finales.

Prueba del sistema con viajes reales de la ciudad de Nueva York

Los investigadores probaron DualG-MARL con datos de viajes a gran escala de la Taxi and Limousine Commission de la ciudad de Nueva York, centrándose en Manhattan y Queens. Compararon su método con una variedad de enfoques existentes, incluidas reglas manuales, optimización matemática y despachadores avanzados basados en aprendizaje como CoopRide. En ambos distritos, el nuevo sistema estableció nuevos referentes en cuatro métricas clave: redujo el tiempo medio que los pasajeros pasan esperando la recogida, aumentó la fracción de solicitudes atendidas con éxito, elevó la proporción del tiempo en que los vehículos llevan clientes y redujo ligeramente la distancia adicional causada por la compartición. Importante: estas mejoras no dispararon los costes computacionales: al limitar la atención a un conjunto curado de emparejamientos prometedores, el método se mantuvo lo suficientemente rápido para uso en tiempo real.

Qué significa esto para los usuarios y las ciudades

En términos sencillos, el estudio muestra que representar el sistema de ridesharing de una ciudad como dos redes estructuradas —una para vehículos y otra para pasajeros— y permitir que interactúen mediante un proceso de aprendizaje cuidadosamente diseñado puede hacer que el pooling sea más inteligente y sensible. Para los pasajeros, eso se traduce en esperas más cortas y recogidas más fiables; para conductores y plataformas, en un mejor uso de los vehículos y menos recorridos en vacío; y para las ciudades, sugiere un futuro en el que las carreteras existentes puedan mover a más personas con menos coches y menos congestión. Los autores sugieren que ideas similares basadas en grafos y multiagente podrían extenderse eventualmente a otros servicios, desde flotas de taxis autónomos hasta respuesta de emergencia, proporcionando una forma más ordenada de gestionar los flujos complejos y cambiantes de la vida urbana moderna.

Cita: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Palabras clave: despacho de ridesharing, aprendizaje por refuerzo multiagente, redes neuronales de grafos, movilidad urbana, emparejamiento dinámico