Clear Sky Science · ru
Мультимодальная и мультиагентная система обучения с подкреплением для прогнозирования городских потоков и оптимизации управления светофорами
Почему важны более «умные» светофоры
Каждый, кто сидел в цепочке красных сигналов или полз по перегруженной улице центра города, знает, насколько неэффективным может быть городской трафик. Помимо раздражения, простаивающие машины расходуют топливо и выбрасывают парниковые газы и загрязнители в атмосферу. В этой статье предлагается новый подход к управлению городским движением, который рассматривает светофоры не как фиксированные таймеры, а как скоординированную самонастраивающуюся сеть с целью быстрее перемещать людей, снижая пробки и выбросы.
Город, который «чувствует» и понимает своё движение
Исследователи предлагают систему под названием MM-STMAP, которая даёт городу нечто вроде цифровой нервной системы. Вместо того чтобы опираться только на простые подсчёты автомобилей, система объединяет множество типов данных одновременно: поток транспорта, скорости, погодные условия вроде дождя или тумана и особые дни, например праздники. Эти разнообразные сигналы очищаются, объединяются и превращаются в единое описание происходящего на дорогах. Распознавая, например, что дождливый праздничный час пик ведёт себя иначе, чем обычный будний день, система может лучше предсказать, как изменится трафик в ближайшие несколько минут.

Вычисление закономерностей в пространстве и времени
Проблемы с трафиком редко ограничиваются одним перекрёстком; они распространяются по всей сети дорог. MM-STMAP отражает это, представляя улицы и перекрёстки как сеть связанных узлов и изучая, как состояния распространяются по этой сети во времени. Система использует многоуровневые вычисления: сначала анализирует, как соседние улицы влияют друг на друга, а затем как эти влияния меняются из шага в шаг. Специальный механизм «внимания» позволяет модели сосредоточить вычислительные ресурсы на наиболее релевантных участках истории — например, на вчерашнем часовом пике в то же время — не теряя эффективности по мере роста объёмов данных. Это делает практической обработку длительных потоков сенсорных данных крупных городских сетей.
Светофоры, которые учатся вместе
На базе этого предиктивного механизма авторы строят систему управления светофорами на основе обучения. Каждый перекрёсток рассматривается как интеллектуальный агент, который может выбирать длительность зелёного и красного сигналов в разных направлениях. Эти агенты не действуют в изоляции: они обмениваются информацией о более широкой дорожной ситуации и обучаются совместно, чтобы их индивидуальные решения способствовали плавному движению по всей сети. Процесс обучения поощряет стратегии, которые увеличивают пропускную способность, сокращают среднее время ожидания и уменьшают движение «стоп‑и‑го», расходующее топливо, одновременно штрафуя конфигурации, вызывающие длинные очереди и задержки.

Проверка системы в реальных условиях
Чтобы оценить, приносит ли MM-STMAP реальные преимущества, команда протестировала систему на больших реальных наборах данных из региона Лос‑Анджелеса. Эти данные включают десятки тысяч выборок с шоссе и городских датчиков, а также реалистичные проблемы, такие как пропуски измерений, помехи в показаниях и нерегулярные паттерны трафика. По сравнению с несколькими современными моделями прогнозирования и с традиционными схемами управления сигналами — фиксированными графиками и локально реагирующими светофорами — новый подход обеспечил более точные краткосрочные прогнозы трафика и более эффективную синхронизацию сигналов. Он снизил распространённые метрики ошибки прогнозирования примерно на треть по сравнению с лучшими на сегодня фиксированными и актюируемыми системами и в симуляциях сократил средние задержки и количество остановок, пропуская при этом больше автомобилей через сеть в час.
Что это значит для обычных водителей
Проще говоря, MM-STMAP описывает будущее, в котором светофоры сотрудничают и постоянно учатся на опыте, вместо того чтобы слепо следовать жёстко запрограммированным циклам. Предугадывая, где вот‑вот образуются заторы, и корректируя тайминги сигналов на нескольких перекрёстках, система может сокращать время поездок, сглаживать движение «стоп‑и‑го» и уменьшать бесполезную работу на холостом ходу. Хотя подход всё ещё сталкивается с проблемами — такими как необходимость надёжных данных и значительных вычислительных мощностей в масштабе города — он указывает путь к более умной и чистой городской мобильности, где наши ежедневные поездки будут не только быстрее, но и менее вредны для окружающей среды.
Цитирование: Wang, R., Zhang, J., Wang, X. et al. Multi-modal and multi-agent reinforcement learning framework for urban traffic flow prediction and signal control optimization. Sci Rep 16, 7612 (2026). https://doi.org/10.1038/s41598-026-37722-5
Ключевые слова: городской трафик, прогнозирование трафика, обучение с подкреплением, интеллектуальные светофоры, интеллектуальный транспорт