Clear Sky Science · es

Esquema de asignación de recursos basado en aprendizaje por refuerzo para la comunicación vehicular en redes 5G para ciudades inteligentes

2026-04-02 · Volver al índice

Por qué el tráfico inteligente necesita gestión inteligente de la energía

A medida que las ciudades se llenan de coches conectados, teléfonos y sensores en la vía, todo ese tráfico inalámbrico consume silenciosamente mucha electricidad. Las redes que permiten que los vehículos hablen entre sí y con los semáforos deben ser rápidas y fiables, pero también respetuosas con el consumo energético si queremos un transporte más limpio y verde. Este estudio explora cómo un tipo sencillo de software de aprendizaje puede ayudar a los coches a elegir automáticamente la cantidad justa de potencia de radio, reduciendo el desperdicio y manteniendo el flujo de mensajes críticos de seguridad.

Figure 1. Cómo los coches conectados y los dispositivos en la calle de 5G comparten datos usando menos energía en una ciudad inteligente.

Coches que aprenden a «hablar» con la intensidad adecuada

El trabajo se centra en los enlaces Vehicle to Everything, donde los coches comparten información con otros vehículos, peatones, unidades en la vía y la red más amplia a través de 5G. En calles concurridas, las señales rebotan en edificios, los vehículos se mueven rápido y la calidad del enlace inalámbrico cambia de un momento a otro. Tradicionalmente, los niveles de potencia se configuran con reglas fijas o planificadores centralizados que tienen dificultades para seguir este movimiento constante. Aquí, en cambio, cada vehículo ejecuta un pequeño agente de aprendizaje que observa su entorno, selecciona un nivel de potencia para su radio y luego aprende a partir de los resultados.

Cómo el aprendizaje dirige el uso de la energía

Los autores se basan en un método llamado Q-learning, elegido porque es lo bastante ligero como para ejecutarse en la electrónica de un coche. El agente vigila mediciones sencillas como la fuerza de su señal respecto a la interferencia, la distancia al receptor y el grado de congestión en la vía. Para cada situación prueba distintos ajustes de potencia y recibe una recompensa numérica que equilibra dos objetivos: enviar datos con rapidez y claridad, pero usar la menor energía posible. Tras muchos ensayos, el agente rellena una pequeña tabla que vincula cada situación con una buena elección de potencia, convergiendo gradualmente hacia una política que funciona bien sin necesitar un procesador grande ni un modelo detallado de la red.

Funcionando en las condiciones reales y complejas de la ciudad

Para probar la idea, los investigadores simulan una intersección urbana concurrida con vehículos, peatones, unidades en la vía y estaciones base 5G. El modelo incluye efectos del mundo real como pérdida de señal con la distancia, reflexiones en edificios y desplazamientos Doppler creados por los coches en movimiento. El agente de aprendizaje comienza explorando casi al azar, por lo que su eficiencia energética y la calidad de los datos fluctúan de una corrida de entrenamiento a otra. Con la experiencia, sin embargo, su comportamiento se estabiliza: tiende a escoger niveles de potencia moderados que mantienen la señal lo bastante fuerte para mensajes de seguridad pero evitan saturar el espectro. Las simulaciones muestran que la eficiencia energética alcanza su pico a ciertas distancias y niveles de calidad de señal, y luego cae cuando los enlaces se vuelven demasiado largos y requerirían potencias excesivas.

Software sencillo para control local robusto

Una fortaleza clave del enfoque es que cada vehículo aprende de forma autónoma, usando solo información local. Si una unidad en la vía falla o la cobertura se debilita temporalmente, el coche detecta que la calidad de su enlace ha bajado y experimenta con alternativas de potencia para recuperar el rendimiento. Dado que la tabla de aprendizaje es pequeña, el método es práctico para hardware embebido y puede reaccionar con rapidez a las condiciones cambiantes del tráfico y del canal. El estudio también analiza cómo las mediciones imperfectas del canal radioeléctrico se promedian con el tiempo, permitiendo al agente encontrar estrategias estables y sensatas sin una visión perfecta de la red.

Figure 2. Cómo un coche aprende a ajustar paso a paso la potencia de su señal inalámbrica para ahorrar energía sin perder un enlace robusto.

Qué significa esto para las calles del futuro

Para los usuarios diarios de la vía, el mensaje es que la misma inteligencia que hace los coches más seguros también puede ayudar a que sean más respetuosos con la red eléctrica. Al permitir que cada vehículo aprenda con qué intensidad «hablar» por el aire, este trabajo muestra un camino hacia sistemas inalámbricos que desperdician menos energía y siguen entregando los enlaces rápidos y fiables necesarios para advertencias de colisión y otros servicios críticos en tiempo. Los autores sugieren que extensiones futuras con múltiples vehículos cooperando y aprendizaje compartido podrían mejorar aún más el uso del espectro radioeléctrico en calles urbanas concurridas.

Cita: Brindha, S., Nasreen, P.P.S., Sagar, P. et al. Reinforcement learning based resource allocation scheme for vehicular communication in 5G networks for smart cities. Sci Rep 16, 15807 (2026). https://doi.org/10.1038/s41598-026-45209-6

Palabras clave: 5G V2X, ciudades inteligentes, aprendizaje por refuerzo, eficiencia energética, comunicación vehicular