Clear Sky Science · ru

Городские крупномасштабные детализированные наборы данных по трафику с уточненными сетями для иерархического управления движением

· Назад к списку

Почему городскому трафику нужны более качественные данные

Каждый, кто стоял на светофоре в цепочке красных сигналов или полз по забитой центральной улице, знает, насколько хаотичным может быть городской трафик. Тем не менее большинство систем управления светофорами и потоками автомобилей по-прежнему опираются на фрагментарные, низкодетализированные данные. В статье представлено новое семейство крупномасштабных городских наборов данных по трафику, призванных дать исследователям и планировщикам гораздо более ясную картину реального движения автомобилей по уличной сети, что открывает возможности для более интеллектуального и скоординированного управления заторами.

От нескольких улиц до целых городов

Авторы собирают и стандартизируют подробные данные о трафике из пяти существенно разных городских районов: Цзинань, Ханчжоу, Манхэттен, Наньчан и Сюаньчэн. Эти города охватывают всё — от коротких магистральных коридоров с десятком перекрёстков до обширных сетей с тысячами узлов. Ранние открытые наборы данных обычно фокусировались на маленьких аккуратных сетках и кратких часовых снимках. Напротив, эта коллекция фиксирует большое разнообразие планировок дорог, форм перекрёстков и моделей спроса. Одним из заметных вкладов является набор данных по Сюаньчэну, который представляет почти весь город с сотнями перекрёстков, смоделированных в высокой детализации, включая расположение отдельных полос и сложную структуру пересечений.

Figure 1
Рисунок 1.

Видеть каждый автомобиль, а не только выборку

Большая часть существующих данных о трафике поступает с камер или разреженных датчиков, которые охватывают лишь части сети и непродолжительные периоды. Данные по Сюаньчэну используют иной подход. В городе установлена система автоматической идентификации транспортных средств (AVI) на ключевых участках дорог, регистрирующая моменты въезда и выезда каждого автомобиля. Сопоставляя анонимные идентификаторы из записей въездов и выездов, авторы восстанавливают полные маршруты сотен тысяч поездок в день в течение целого месяца. Это позволяет увидеть, как водители действительно выбирают маршруты, как потоки меняются в будни и выходные и как праздники трансформируют спрос. Транспортные средства также классифицируются по крупным типам, например пассажирские и грузовые, чтобы симуляции отражали влияние разных видов машин на трафик.

Преобразование разрозненных записей в единую карту

Поскольку исходные данные пяти городов хранились в разных форматах и с разной степенью детализации, команда разработала единый процесс обработки. Сначала они восстанавливают каждую дорожную сеть в виде согласованной цифровой карты, идентифицируя перекрёстки и соединяющие дороги даже тогда, когда исходные источники используют разные определения геометрии. Они оценивают размер и положение перекрёстков, заключая сырые формы в простые прямоугольники, и выравнивают подходы по основным направлениям с помощью оптимизационного метода. Затем они стандартизируют сигналы светофоров, определив небольшой набор типичных шаблонов движений — например, левые повороты или прямые движения по каждому коридору — и автоматически сопоставляют каждый реальный перекрёсток с этими шаблонами. Наконец, они строят потоки автомобилей и очищают данные: неправдоподобные маршруты удаляются, отсутствующие сегменты выводятся из сети, а непрерывные поездки собираются из множества коротких показаний датчиков.

Figure 2
Рисунок 2.

От отдельных машин к целым сетям

Когда поездки и сети готовы, авторы генерируют данные «состояния» трафика на трёх уровнях. На самом подробном уровне они отслеживают отдельные транспортные средства, включая их положения и скорости — это полезно для проверки идей вроде более плавной маршрутизации или формирования плотных колонн автомобилей (платунов). На среднем уровне они суммируют условия по каждой полосе и перекрёстку, такие как очереди и плотности — информация, критичная для настройки светофорных циклов. На самом широком уровне они агрегируют показатели по целым районам города, поддерживая стратегии, регулирующие, сколько автомобилей допускается в перегруженную зону. Всё это упаковано в общий формат симуляции (CityFlow), чтобы разные методы управления можно было тестировать справедливо и эффективно.

Проверка того, что цифровой город соответствует реальности

Чтобы убедиться, что восстановленный мир похож на реальный, исследователи валидируют и карты, и поездки. Они сравнивают преобразованную дорожную сеть с исходными географическими данными и обнаруживают, что большинство связей и позиций сохраняются в пределах всего нескольких метров. Для поездок они моделируют движение по выбранной дороге и сравнивают времена в пути с реальными измерениями; средние значения очень близки, а небольшие расхождения объясняются такими факторами, как эпизодические превышения скорости водителями в реальном мире. Они также показывают, что полученные данные о состоянии поддерживают продвинутые стратегии: использование информации на уровне полос для применения управления сигналами на базе «давления», далее добавление общегородского «периферийного» контроля, чтобы не допустить перегрузки центральной зоны, и в завершение демонстрация того, что перенаправление одного автомобиля на основе этой информации может сократить его время в пути в условиях плотного трафика.

Что это значит для обычных водителей

Для неспециалистов важность этой работы заключается не столько в алгоритмах, сколько в основе, которую она закладывает. Публикуя подробные, хорошо проверенные и открыто документированные наборы данных, авторы дают дорожным инженерам и исследователям в области ИИ реалистичную площадку для разработки и испытаний новых схем управления прежде, чем они будут внедрены на улицах. С точными представлениями о том, как устроены дороги, как работают сигналы и как спрос меняется в течение дней и недель, будущие инструменты смогут быть тонко настроены для сокращения задержек, экономии топлива и повышения предсказуемости городских поездок. Проще говоря, эти наборы данных — важный шаг на пути к системам управления трафиком, которые реагируют на реальную сложность, а не на идеализированные модели.

Цитирование: Ma, Q., Guo, X., Zhong, W. et al. City-scale high-resolution traffic datasets with refined networks for hierarchical traffic control. Sci Data 13, 547 (2026). https://doi.org/10.1038/s41597-026-06892-2

Ключевые слова: данные городского трафика, иерархическое управление движением, моделирование трафика, автоматическая идентификация транспортных средств, городская мобильность