Clear Sky Science · es
Conjuntos de datos de tráfico a escala municipal y alta resolución con redes refinadas para control jerárquico del tráfico
Por qué el tráfico urbano necesita mejores datos
Cualquiera que haya pasado por una sucesión de semáforos en rojo o haya avanzado a paso de tortuga por una calle céntrica atascada ha notado lo caótico que puede ser el tráfico urbano. Sin embargo, la mayoría de los sistemas que controlan esos semáforos y gestionan los flujos siguen basándose en datos incompletos y de baja resolución. Este artículo presenta una nueva familia de conjuntos de datos de tráfico a escala de ciudad diseñados para ofrecer a investigadores y planificadores una imagen mucho más clara de cómo se desplazan realmente los vehículos por redes viales reales, abriendo la puerta a un control de la congestión más inteligente y coordinado.
De unas pocas calles a ciudades enteras
Los autores recopilan y estandarizan datos de tráfico detallados de cinco áreas urbanas muy diferentes: Jinan, Hangzhou, Manhattan, Nanchang y Xuancheng. Estas ciudades abarcan desde corredores arteriales cortos con apenas una docena de intersecciones hasta redes extensas con miles de cruces. Los conjuntos de datos abiertos anteriores se centraban típicamente en rejillas pequeñas y ordenadas y en instantáneas de una hora. En contraste, esta colección captura una amplia variedad de configuraciones viales, formas de intersección y patrones de demanda. Una de las contribuciones más destacadas es el conjunto de Xuancheng, que representa casi una ciudad completa con cientos de intersecciones modeladas con gran detalle, incluyendo la disposición de carriles individuales y la estructura de intersecciones complejas.

Ver cada vehículo, no solo una muestra
La mayoría de los datos de tráfico existentes provienen de cámaras o sensores dispersos, que solo registran partes de la red y durante periodos breves. Los datos de Xuancheng adoptan un enfoque distinto. La ciudad dispone de un sistema de identificación automática de vehículos (AVI) instalado en tramos viales clave, que registra cuándo cada vehículo entra y sale. Al emparejar identificadores anónimos de los registros de entrada y salida, los autores reconstruyen trayectos completos para cientos de miles de viajes al día durante un mes entero. Esto les permite observar cómo eligen realmente las rutas los conductores, cómo varían los flujos entre días laborables y fines de semana, y cómo las festividades alteran la demanda. Además, los vehículos se clasifican en tipos amplios, como pasajeros y mercancías, de modo que las simulaciones puedan reflejar cómo distintos tipos de vehículos afectan al tráfico.
Convertir registros desordenados en un mapa común
Dado que los datos en bruto de las cinco ciudades estaban almacenados en distintos formatos y niveles de detalle, el equipo desarrolló un flujo de procesamiento unificado. Primero, reconstruyen cada red vial como un mapa digital coherente, identificando intersecciones y conectando carreteras incluso cuando las fuentes originales usan definiciones geométricas diferentes. Estiman el tamaño y la posición de las intersecciones envolviendo las formas originales en rectángulos simples y alinean los accesos con direcciones cardinales mediante un método de optimización. A continuación, estandarizan las señales de tráfico definiendo un pequeño conjunto de patrones de movimiento típicos —como giros a la izquierda o movimientos rectos a lo largo de cada corredor— y asocian automáticamente cada intersección real con estos patrones. Finalmente, construyen los flujos de vehículos y limpian los datos: eliminan rutas implausibles, infieren segmentos faltantes a partir de la red y ensamblan viajes continuos a partir de muchas lecturas cortas de sensores.

De vehículos individuales a redes completas
Una vez que los viajes y las redes están listos, los autores generan datos de "estado" del tráfico en tres niveles. En el nivel más detallado, rastrean vehículos individuales, incluyendo sus posiciones y velocidades, lo que puede usarse para probar ideas como rutas más suaves o pelotones de vehículos. En el nivel intermedio, resumen las condiciones en cada carril e intersección, como colas y densidades —información crucial para ajustar los semáforos. En el nivel más amplio, agregan condiciones a lo largo de zonas enteras de la ciudad, apoyando estrategias que regulan cuántos vehículos pueden acceder a una región congestionada. Todo ello se empaqueta en un formato de simulación común (CityFlow), de modo que distintos métodos de control puedan probarse de forma justa y eficiente.
Comprobar que la ciudad digital coincide con la realidad
Para asegurarse de que su mundo reconstruido se parece al real, los investigadores validan tanto los mapas como los trayectos. Comparan la red vial convertida con los datos geográficos originales y encuentran que la mayoría de las conexiones y posiciones se preservan con solo unos pocos metros de diferencia. Para los viajes, simulan vehículos a lo largo de una vía seleccionada y comparan los tiempos de viaje con mediciones reales; las medias son muy parecidas, con pequeñas diferencias explicadas por factores como que en el mundo real los conductores en ocasiones exceden los límites de velocidad. También demuestran que los datos de estado derivados pueden soportar estrategias avanzadas: usar información a nivel de carril para aplicar un control de semáforos basado en presión, añadir luego un control "perimetral" a escala de ciudad para evitar la sobrecarga de un área central y, finalmente, mostrar que desviar un único vehículo con base en esta información puede reducir su tiempo de viaje en tráfico denso.
Qué significa esto para los conductores cotidianos
Para quienes no son especialistas, la importancia de este trabajo reside menos en los algoritmos y más en la base que proporciona. Al publicar conjuntos de datos detallados, bien validados y documentados abiertamente, los autores ofrecen a ingenieros de tráfico e investigadores en IA un campo de pruebas realista para diseñar y evaluar nuevos esquemas de control antes de aplicarlos en calles reales. Con representaciones precisas de cómo se disponen las vías, cómo operan las señales y cómo la demanda sube y baja a lo largo de días y semanas, las herramientas futuras podrán ajustarse para reducir demoras, ahorrar combustible y hacer el tránsito urbano más predecible. En resumen, estos conjuntos de datos son un peldaño esencial hacia sistemas de tráfico que respondan a la complejidad del mundo real en lugar de a modelos idealizados.
Cita: Ma, Q., Guo, X., Zhong, W. et al. City-scale high-resolution traffic datasets with refined networks for hierarchical traffic control. Sci Data 13, 547 (2026). https://doi.org/10.1038/s41597-026-06892-2
Palabras clave: datos de tráfico urbano, control jerárquico del tráfico, simulación de tráfico, identificación automática de vehículos, movilidad a escala de ciudad