Clear Sky Science · ru
Алгоритм планирования на основе многопользовательского обучения с подкреплением, интегрирующий структурное моделирование графа состояний и графа задач для диспетчеризации райдшеринга
Почему умный райдшеринг важен для жизни города
Тот, кто слишком долго ждал вызванную машину или видел, как пустые автомобили проезжают мимо оживлённых перекрёстков, знает, как сложно координировать городской транспорт в реальном времени. В этом исследовании предлагается новая система диспетчеризации на базе ИИ, рассчитанная на более быстрое и эффективное сопоставление пассажиров и автомобилей для совместных поездок, что сокращает пустой пробег и уменьшает время ожидания в густонаселенном и быстро меняющемся городском трафике.
От простых совпадений к запутанному городскому движению
Райдшеринг начался с простой идеи: один водитель, один пассажир, одна поездка. Сегодня городские улицы выглядят совсем иначе. Платформы одновременно управляют тысячами машин и пассажиров, часто объединив в одну поездку нескольких пассажиров и маршрутизируя автопарк по целым районам. Спрос распределяется неравномерно — в центре может быть шквал заявок, тогда как в другом районе тишь — и всё меняется из минуты в минуту. Традиционные правила диспетчеризации или простые стратегии «самая ближайшая машина» испытывают трудности в таких условиях, что ведёт к долгому ожиданию, низкой загрузке автомобилей и ненужным объездам. Рисунок 
Две связанные карты вместо одного смазанного вида
Авторы предлагают новую архитектуру под названием DualG-MARL, которая рассматривает задачу диспетчеризации как две перекрывающиеся карты. Одна карта описывает транспортные средства: где они находятся, сколько у них мест и свободны ли они или уже везут пассажиров. Другая карта описывает запросы на поездки: кто хочет ехать, откуда, куда и в какое время. Каждая карта моделируется как граф, где узлы представляют автомобили или запросы, а рёбра связывают те, что близки по пространству и времени. Сохраняя информацию об автомобилях и пассажирах в отдельных, но связанных графах, система сохраняет структуру каждой стороны вместо того, чтобы смешивать всё в одну, запутанную картину.
Как ИИ учится сопоставлять пассажиров и машины
Поверх этих двойных графов система использует класс методов машинного обучения, известный как многопользовательское обучение с подкреплением. Каждый автомобиль рассматривается как самостоятельный принимающий решения агент, который выбирает из близлежащих запросов. Агенты разделяют общую цель: снизить время ожидания, избегать чрезмерных объездов и держать автомобили занятыми продуктивной работой. Модель просматривает оба графа, чтобы выявить закономерности, а затем использует механизм внимания — инструмент ИИ, который выделяет наиболее релевантные связи — чтобы связать подходящие автомобили и пассажиров между двумя картами. Чтобы решения оставались быстрыми и стабильными, система не рассматривает все возможные пары. Вместо этого она формирует шорт-лист лучших кандидатов для каждого автомобиля (набор Top-K), отфильтрованный жёсткими правилами, такими как вместимость, время ожидания при посадке и допустимая длина объезда. Централизованный обучающий модуль оценивает, насколько эффективен весь флот, в то время как отдельные машины в реальном времени следуют простым локальным правилам. Рисунок 
Тестирование системы на реальных поездках Нью-Йорка
Исследователи протестировали DualG-MARL на крупном наборе данных поездок Комиссии по такси и лимузинам Нью-Йорка, сосредоточившись на Манхэттене и Куинсе. Они сравнили свой метод с рядом существующих подходов, включая вручную разработанные правила, математическую оптимизацию и продвинутые обучаемые диспетчерские системы, такие как CoopRide. В обоих боро новая система установила новые ориентиры по четырём ключевым метрикам: сократила среднее время ожидания пассажиров до посадки, увеличила долю успешно обслуженных запросов, повысила долю времени, в течение которого автомобили везли клиентов, и слегка снизила дополнительный пробег, вызванный совместными поездками. Важно, что эти улучшения были достигнуты без чрезмерного роста вычислительных затрат: за счёт ограничения внимания к курируемому набору перспективных совпадений метод оставался достаточно быстрым для работы в реальном времени.
Что это значит для пассажиров и городов
Проще говоря, исследование показывает, что представление системы райдшеринга города в виде двух структурированных сетей — одной для автомобилей и другой для пассажиров — и их взаимодействие через тщательно продуманный процесс обучения могут сделать карпулинг умнее и более отзывчивым. Для пассажиров это означает более короткое ожидание и более надёжные посадки; для водителей и платформ — более эффективное использование автомобилей и меньше пустого пробега; для городов — намёк на будущее, в котором существующие дороги смогут перевозить больше людей с меньшим количеством машин и меньшими пробками. Авторы предполагают, что аналогичные графовые многопользовательские идеи в будущем могут распространиться на другие сервисы — от автономных такси до экстренных служб — предлагая более упорядоченный способ управления сложными, постоянно меняющимися потоками современной городской жизни.
Цитирование: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8
Ключевые слова: диспетчеризация райдшеринга, многопользовательское обучение с подкреплением, графовые нейронные сети, городская мобильность, динамическое сопоставление