Clear Sky Science · nl

Een multi-agent reinforcement learning-planningsalgoritme dat toestandsgrafen en taakgraf-structurele modellering integreert voor ritdelen-dispatching

· Terug naar het overzicht

Waarom slimmer ritdelen belangrijk is voor het stadsleven

Wie ooit te lang heeft gewacht op een rit via een app, of lege voertuigen langs drukke hoeken heeft zien rijden, weet hoe lastig het is om stedelijk vervoer in realtime te coördineren. Deze studie introduceert een nieuw op AI gebaseerd dispatchsysteem dat passagiers en ritdelende voertuigen sneller en efficiënter wil koppelen, waardoor onnodige kilometers en wachttijden in dichtbevolkte, snel veranderende stadsomgevingen verminderen.

Van eenvoudige matches naar verstrengelde stadsstromen

Ride-hailing begon met een simpel idee: één chauffeur, één passagier, één rit. Tegenwoordig zien de straten er heel anders uit. Platforms coördineren duizenden voertuigen en reizigers tegelijk, vaak door meerdere passagiers in één auto te combineren en vloten over hele stadsdelen te routeren. De vraag is ongelijk verdeeld—het centrum kan overspoeld worden met verzoeken terwijl een ander gebied rustig is—and alles verandert van minuut tot minuut. Traditionele regelgebaseerde dispatchregels of eenvoudige strategieën als "dichtstbijzijnde auto" worstelen in deze situatie, wat leidt tot lange wachttijden, lage voertuigbezetting en onnodige omwegen. Figuur

Figure 1
Figure 1.
illustreert hoe deze systemen moeten evolueren van eenvoudige één-op-één matches naar complexe veel-op-veel deelrelaties.

Twee verbonden kaarten in plaats van één vaag geheel

De auteurs stellen een nieuw kader voor, DualG-MARL, dat het dispatchprobleem beschouwt als twee overlappende kaarten. De ene kaart beschrijft de voertuigen: waar ze zich bevinden, hoeveel zitplaatsen ze hebben en of ze vrij zijn of al passagiers vervoeren. De andere kaart beschrijft de ritverzoeken: wie wil reizen, van waar, naar waar en op welk tijdstip. Elke kaart wordt gemodelleerd als een graaf, waarbij punten auto’s of verzoeken voorstellen en lijnen die dichtbij elkaar liggende in ruimte en tijd verbinden. Door voertuig- en passagiersinformatie in aparte maar gekoppelde grafen te houden, behoudt het systeem de structuur van beide zijden in plaats van alles in één verwarrend beeld te mengen.

Hoe de AI leert om reizigers en auto’s te koppelen

Bovenop deze dubbele grafen gebruikt het systeem een klasse van machine learning-methoden die bekendstaat als multi-agent reinforcement learning. Elk voertuig wordt behandeld als een onafhankelijke beslisser, of "agent", die kiest uit nabijgelegen verzoeken. De agenten delen een gemeenschappelijk doel: wachttijden verminderen, buitensporige omwegen vermijden en auto's productief bezet houden. Het model scant beide grafen om patronen te extraheren en gebruikt vervolgens een attentiemechanisme—een AI-hulpmiddel dat de meest relevante verbindingen benadrukt—om geschikte auto’s en reizigers tussen de twee kaarten te koppelen. Om beslissingen snel en stabiel te houden, overweegt het niet elk denkbaar paar. In plaats daarvan bouwt het voor elk voertuig een shortlist van topkandidaten (de Top-K-set), gefilterd door harde regels zoals zitcapaciteit, ophaalvertraging en acceptabele omwegafstand. Een gecentraliseerde learner evalueert hoe de hele vloot presteert, terwijl individuele auto’s tijdens de realtime operatie eenvoudige lokale regels volgen. Figuur

Figure 2
Figure 2.
toont deze stroom van voertuig- en taakgrafen via de matchingmodule naar de uiteindelijke toewijzingen.

Het systeem testen op echte ritten in New York City

De onderzoekers testten DualG-MARL op grootschalige ritgegevens van de Taxi and Limousine Commission van New York City, met focus op Manhattan en Queens. Ze vergeleken hun methode met een reeks bestaande benaderingen, waaronder handgemaakte regels, wiskundige optimalisatie en geavanceerde op leren gebaseerde dispatchers zoals CoopRide. In beide boroughs zette het nieuwe systeem nieuwe maatstaven op vier belangrijke meetpunten: het verminderde de gemiddelde wachttijd tot ophalen, verhoogde het aandeel ritverzoeken dat succesvol werd bediend, vergrootte het aandeel tijd dat voertuigen passagiers vervoerden, en verlaagde lichtjes de extra afstand veroorzaakt door het delen van ritten. Belangrijk is dat deze winst werd behaald zonder explosieve toename van rekenkosten: door de aandacht te beperken tot een zorgvuldig samengestelde set veelbelovende matches bleef de methode snel genoeg voor realtime gebruik.

Wat dit betekent voor dagelijkse reizigers en steden

Vrijwel gezegd laat de studie zien dat het representeren van een stedelijk rit-hailing-systeem als twee gestructureerde netwerken—één voor voertuigen en één voor reizigers—en ze elkaar laten beïnvloeden via een zorgvuldig ontworpen leerproces, pooling slimmer en responsiever kan maken. Voor passagiers betekent dat kortere wachttijden en betrouwbaardere ophaalmomenten; voor chauffeurs en platforms betekent het beter gebruik van voertuigen en minder leeg rijden; en voor steden suggereert het een toekomst waarin bestaande wegen meer mensen kunnen vervoeren met minder auto’s en minder congestie. De auteurs stellen dat vergelijkbare graafgebaseerde, multi-agent ideeën uiteindelijk kunnen worden uitgebreid naar andere diensten, van autonome taxivloten tot noodhulp, en zo een ordelijkere manier bieden om de complexe, verschuivende stromen van het moderne stadsleven te beheren.

Bronvermelding: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Trefwoorden: ritdelen-dispatch, multi-agent reinforcement learning, graphneuralnetwerken, stedelijke mobiliteit, dynamische matching