Clear Sky Science · es

Marco de aprendizaje por refuerzo multimodal y multiagente para la predicción del flujo de tráfico urbano y la optimización del control de semáforos

· Volver al índice

Por qué importan semáforos más inteligentes

Quien haya pasado por una secuencia de semáforos en rojo o haya avanzado a paso de tortuga por una calle céntrica atascada conoce lo ineficiente que puede ser el tráfico urbano. Más allá de la frustración, los coches al ralentí consumen combustible y emiten gases de efecto invernadero y contaminantes. Este artículo presenta una nueva forma de gestionar el tráfico urbano que considera los semáforos como una red coordinada y que aprende, en lugar de usar temporizadores fijos, con el objetivo de desplazar a las personas más rápido reduciendo la congestión y las emisiones.

Una ciudad que siente y comprende su tráfico

Los investigadores proponen un sistema llamado MM-STMAP que dota a la ciudad de una suerte de sistema nervioso digital. En lugar de confiar solo en sencillos recuentos de vehículos, integra simultáneamente distintos tipos de datos: flujo de tráfico, velocidades, condiciones meteorológicas como lluvia o niebla y días especiales como festivos. Estas señales diversas se limpian, combinan y convierten en una descripción unificada de lo que ocurre en las vías. Al reconocer, por ejemplo, que una hora punta festiva con lluvia se comporta de modo distinto a un día laborable ordinario, el sistema puede anticipar mejor cómo evolucionará el tráfico en los próximos minutos.

Figure 1
Figure 1.

Detectando patrones en el espacio y el tiempo

Los problemas de tráfico rara vez se limitan a un solo cruce; se propagan por toda una red de vías. MM-STMAP captura esto representando las calles y las intersecciones de la ciudad como una red de puntos conectados y luego aprendiendo cómo se transmiten las condiciones a través de esa red a lo largo del tiempo. Utiliza cálculos por capas que primero examinan cómo se influyen mutuamente las calles vecinas y después cómo cambian esas influencias de un paso temporal al siguiente. Un mecanismo de “atención” diseñado específicamente permite al modelo concentrar su capacidad de cálculo en los tramos históricos más relevantes —por ejemplo, la hora punta de ayer a la misma hora— sin saturarse a medida que crecen los volúmenes de datos. Esto hace que sea práctico procesar flujos de sensores de larga duración en grandes redes urbanas.

Semáforos que aprenden juntos

Sobre este motor predictivo, los autores construyen un sistema de control basado en aprendizaje para los semáforos. Cada intersección se trata como un agente inteligente que puede elegir cuánto tiempo mantener el verde o el rojo en distintas direcciones. Estos agentes no actúan de forma aislada: comparten información sobre la situación de tráfico más amplia y se entrenan conjuntamente para que sus decisiones individuales favorezcan un flujo suave en toda la red. El proceso de aprendizaje recompensa patrones que aumentan el número de vehículos que atraviesan la red, reducen los tiempos de espera medios y disminuyen el comportamiento stop-and-go que desperdicia combustible, mientras penaliza configuraciones que crean colas y retrasos prolongados.

Figure 2
Figure 2.

Poniendo el sistema a prueba

Para evaluar si MM-STMAP ofrece beneficios reales, el equipo lo probó con grandes conjuntos de datos del mundo real de la región de Los Ángeles. Estos datos incluyen decenas de miles de muestras de sensores de autopistas y zonas urbanas, junto con problemas realistas como lecturas perdidas, mediciones ruidosas y patrones de tráfico irregulares. En comparación con varios modelos de pronóstico de última generación y con esquemas tradicionales de control de semáforos —horarios fijos y luces reactivos locales—, el nuevo enfoque produjo predicciones de tráfico a corto plazo más precisas y temporizaciones de semáforos más eficientes. Redujo las medidas de error comunes en la previsión en alrededor de un tercio respecto a los sistemas fijos y actuados de mejor rendimiento actuales, y en simulaciones acortó los retrasos medios y el número de paradas mientras aumentaba el número de vehículos que atraviesan la red por hora.

Qué significa esto para los conductores de a pie

En términos sencillos, MM-STMAP describe un futuro en el que los semáforos cooperan y aprenden continuamente de la experiencia, en lugar de seguir ciegamente ciclos codificados. Al anticipar dónde están a punto de formarse atascos y ajustar la temporización de las señales en múltiples intersecciones, el sistema puede acortar los tiempos de desplazamiento, suavizar el tráfico intermitente y reducir los ralentíes innecesarios. Si bien el enfoque aún afronta retos —como la necesidad de datos fiables y una considerable potencia informática a escala municipal—, apunta hacia una movilidad urbana más inteligente y limpia en la que nuestros desplazamientos diarios no solo sean más rápidos, sino también menos dañinos para el medio ambiente.

Cita: Wang, R., Zhang, J., Wang, X. et al. Multi-modal and multi-agent reinforcement learning framework for urban traffic flow prediction and signal control optimization. Sci Rep 16, 7612 (2026). https://doi.org/10.1038/s41598-026-37722-5

Palabras clave: tráfico urbano, predicción del tráfico, aprendizaje por refuerzo, semáforos inteligentes, transporte inteligente