Clear Sky Science · ru

Алгоритм планирования на основе многопользовательского обучения с подкреплением, интегрирующий структурное моделирование графа состояний и графа задач для диспетчеризации райдшеринга

· Назад к списку

Почему умный райдшеринг важен для жизни города

Тот, кто слишком долго ждал вызванную машину или видел, как пустые автомобили проезжают мимо оживлённых перекрёстков, знает, как сложно координировать городской транспорт в реальном времени. В этом исследовании предлагается новая система диспетчеризации на базе ИИ, рассчитанная на более быстрое и эффективное сопоставление пассажиров и автомобилей для совместных поездок, что сокращает пустой пробег и уменьшает время ожидания в густонаселенном и быстро меняющемся городском трафике.

От простых совпадений к запутанному городскому движению

Райдшеринг начался с простой идеи: один водитель, один пассажир, одна поездка. Сегодня городские улицы выглядят совсем иначе. Платформы одновременно управляют тысячами машин и пассажиров, часто объединив в одну поездку нескольких пассажиров и маршрутизируя автопарк по целым районам. Спрос распределяется неравномерно — в центре может быть шквал заявок, тогда как в другом районе тишь — и всё меняется из минуты в минуту. Традиционные правила диспетчеризации или простые стратегии «самая ближайшая машина» испытывают трудности в таких условиях, что ведёт к долгому ожиданию, низкой загрузке автомобилей и ненужным объездам. Рисунок

Figure 1
Figure 1.
иллюстрирует, как этим системам необходимо развиваться от простых один-к-одному совпадений к сложным многократно-связным отношениям совместного пользования.

Две связанные карты вместо одного смазанного вида

Авторы предлагают новую архитектуру под названием DualG-MARL, которая рассматривает задачу диспетчеризации как две перекрывающиеся карты. Одна карта описывает транспортные средства: где они находятся, сколько у них мест и свободны ли они или уже везут пассажиров. Другая карта описывает запросы на поездки: кто хочет ехать, откуда, куда и в какое время. Каждая карта моделируется как граф, где узлы представляют автомобили или запросы, а рёбра связывают те, что близки по пространству и времени. Сохраняя информацию об автомобилях и пассажирах в отдельных, но связанных графах, система сохраняет структуру каждой стороны вместо того, чтобы смешивать всё в одну, запутанную картину.

Как ИИ учится сопоставлять пассажиров и машины

Поверх этих двойных графов система использует класс методов машинного обучения, известный как многопользовательское обучение с подкреплением. Каждый автомобиль рассматривается как самостоятельный принимающий решения агент, который выбирает из близлежащих запросов. Агенты разделяют общую цель: снизить время ожидания, избегать чрезмерных объездов и держать автомобили занятыми продуктивной работой. Модель просматривает оба графа, чтобы выявить закономерности, а затем использует механизм внимания — инструмент ИИ, который выделяет наиболее релевантные связи — чтобы связать подходящие автомобили и пассажиров между двумя картами. Чтобы решения оставались быстрыми и стабильными, система не рассматривает все возможные пары. Вместо этого она формирует шорт-лист лучших кандидатов для каждого автомобиля (набор Top-K), отфильтрованный жёсткими правилами, такими как вместимость, время ожидания при посадке и допустимая длина объезда. Централизованный обучающий модуль оценивает, насколько эффективен весь флот, в то время как отдельные машины в реальном времени следуют простым локальным правилам. Рисунок

Figure 2
Figure 2.
показывает этот поток от графов автомобилей и задач через модуль сопоставления до окончательных назначений.

Тестирование системы на реальных поездках Нью-Йорка

Исследователи протестировали DualG-MARL на крупном наборе данных поездок Комиссии по такси и лимузинам Нью-Йорка, сосредоточившись на Манхэттене и Куинсе. Они сравнили свой метод с рядом существующих подходов, включая вручную разработанные правила, математическую оптимизацию и продвинутые обучаемые диспетчерские системы, такие как CoopRide. В обоих боро новая система установила новые ориентиры по четырём ключевым метрикам: сократила среднее время ожидания пассажиров до посадки, увеличила долю успешно обслуженных запросов, повысила долю времени, в течение которого автомобили везли клиентов, и слегка снизила дополнительный пробег, вызванный совместными поездками. Важно, что эти улучшения были достигнуты без чрезмерного роста вычислительных затрат: за счёт ограничения внимания к курируемому набору перспективных совпадений метод оставался достаточно быстрым для работы в реальном времени.

Что это значит для пассажиров и городов

Проще говоря, исследование показывает, что представление системы райдшеринга города в виде двух структурированных сетей — одной для автомобилей и другой для пассажиров — и их взаимодействие через тщательно продуманный процесс обучения могут сделать карпулинг умнее и более отзывчивым. Для пассажиров это означает более короткое ожидание и более надёжные посадки; для водителей и платформ — более эффективное использование автомобилей и меньше пустого пробега; для городов — намёк на будущее, в котором существующие дороги смогут перевозить больше людей с меньшим количеством машин и меньшими пробками. Авторы предполагают, что аналогичные графовые многопользовательские идеи в будущем могут распространиться на другие сервисы — от автономных такси до экстренных служб — предлагая более упорядоченный способ управления сложными, постоянно меняющимися потоками современной городской жизни.

Цитирование: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Ключевые слова: диспетчеризация райдшеринга, многопользовательское обучение с подкреплением, графовые нейронные сети, городская мобильность, динамическое сопоставление