Clear Sky Science · de

Ein Multi-Agenten-Verstärkungslern-Planungsalgorithmus, der Zustandsgraph- und Aufgabengraph-Strukturmodellierung für Ride-Sharing-Dispositionssysteme integriert

· Zurück zur Übersicht

Warum intelligenteres Ride-Sharing für das Stadtleben wichtig ist

Wer schon einmal zu lange auf ein Ride-Hailing-Fahrzeug gewartet oder leere Fahrzeuge an belebten Ecken vorbeifahren gesehen hat, weiß, wie schwierig es ist, städtischen Verkehr in Echtzeit zu koordinieren. Diese Studie stellt ein neues, KI-basiertes Dispositionssystem vor, das Fahrgäste und Ride-Sharing-Fahrzeuge schneller und effizienter zusammenbringen soll, Fahrkilometer ohne Passagiere reduziert und Wartezeiten in dichten, sich schnell verändernden Stadtverhältnissen verkürzt.

Von einfachen Zuordnungen zu vernetzten Stadtverkehren

Ride-Hailing begann mit einer einfachen Idee: ein Fahrer, ein Fahrgast, eine Fahrt. Die Straßen heutiger Städte sehen anders aus. Plattformen steuern tausende Fahrzeuge und Fahrgäste gleichzeitig, bündeln oft mehrere Personen im selben Wagen und leiten Flotten über ganze Stadtteile. Die Nachfrage ist ungleichmäßig – die Innenstadt kann mit Anfragen überschwemmt sein, während ein anderes Viertel ruhig bleibt – und alles ändert sich minutengenau. Traditionelle regelbasierte Dispositionsstrategien oder einfache "nächstes Fahrzeug"-Ansätze tun sich in diesem Umfeld schwer, was zu langen Wartezeiten, niedriger Fahrzeugauslastung und unnötigen Umwegen führt. Abbildung

Figure 1
Figure 1.
veranschaulicht, wie sich diese Systeme von einfachen Eins-zu-Eins-Zuordnungen zu komplexen Viele-zu-Viele-Sharing-Beziehungen entwickeln müssen.

Zwei verbundene Karten statt eines großen Breis

Die Autoren schlagen ein neues Framework namens DualG-MARL vor, das das Dispositionsproblem als zwei sich überlappende Karten behandelt. Eine Karte beschreibt die Fahrzeuge: wo sie sich befinden, wie viele Sitzplätze sie haben und ob sie frei oder bereits mit Fahrgästen unterwegs sind. Die andere Karte beschreibt die Fahranfragen: wer reisen möchte, von wo nach wo und zu welcher Zeit. Jede Karte wird als Graph modelliert, wobei Punkte Autos oder Anfragen darstellen und Kanten diejenigen verbinden, die räumlich und zeitlich nah beieinander liegen. Indem Fahrzeug- und Fahrgastinformationen in separaten, aber verknüpften Graphen gehalten werden, bewahrt das System die jeweilige Struktur, statt alles zu einem einzigen, verwirrenden Bild zu vermischen.

Wie die KI lernt, Fahrgäste und Autos zuzuordnen

Aufbauend auf diesen Zwillingsgraphen verwendet das System eine Klasse von Methoden des maschinellen Lernens, die als Multi-Agenten-Verstärkungslernen bekannt sind. Jedes Fahrzeug wird als unabhängiger Entscheidungsträger oder "Agent" behandelt, der unter nahegelegenen Anfragen wählt. Die Agenten teilen ein gemeinsames Ziel: Wartezeiten reduzieren, übermäßige Umwege vermeiden und Fahrzeuge produktiv ausgelastet halten. Das Modell scannt beide Graphen, um Muster zu extrahieren, und nutzt dann einen Attention-Mechanismus – ein KI-Werkzeug, das die relevantesten Verbindungen hervorhebt –, um passende Autos und Fahrgäste über die beiden Karten hinweg zu verknüpfen. Um Entscheidungen schnell und stabil zu halten, betrachtet es nicht jedes mögliche Paar. Stattdessen erstellt es für jedes Fahrzeug eine Shortlist der besten Kandidaten (die Top-K-Menge), gefiltert durch harte Regeln wie Sitzkapazität, zulässige Abholverzögerung und akzeptable Umweglängen. Ein zentralisierter Lerner bewertet die Leistung der gesamten Flotte, während einzelne Fahrzeuge im Echtzeitbetrieb einfachen lokalen Regeln folgen. Abbildung

Figure 2
Figure 2.
zeigt diesen Fluss von Fahrzeug- und Aufgabengraphen über das Matching-Modul bis hin zu den endgültigen Zuweisungen.

Test des Systems an echten Fahrten in New York City

Die Forschenden evaluierten DualG-MARL anhand großskaliger Fahrdaten der Taxi and Limousine Commission von New York City mit Schwerpunkt auf Manhattan und Queens. Sie verglichen ihre Methode mit einer Reihe bestehender Ansätze, darunter handcodierte Regeln, mathematische Optimierung und fortgeschrittene lernbasierte Disponenten wie CoopRide. In beiden Boroughs setzte das neue System bei vier zentralen Kennzahlen neue Maßstäbe: Es verkürzte die durchschnittliche Wartezeit bis zur Abholung, erhöhte den Anteil erfolgreich bedienter Fahranfragen, steigerte den Anteil der Zeit, in der Fahrzeuge Kundinnen und Kunden beförderten, und verringerte leicht die zusätzliche Distanz durch das Teilen von Fahrten. Wichtig ist, dass diese Verbesserungen nicht zu massiv höheren Rechenkosten führten: Durch die Beschränkung der Attention auf eine kuratierte Menge vielversprechender Matches blieb die Methode schnell genug für den Echtzeiteinsatz.

Was das für Fahrgäste und Städte bedeutet

Einfach gesagt zeigt die Studie, dass die Darstellung eines städtischen Ride-Hailing-Systems als zwei strukturierte Netzwerke – eines für Fahrzeuge und eines für Fahrgäste – und deren Interaktion über einen sorgfältig gestalteten Lernprozess Pooling intelligenter und reaktionsfähiger machen kann. Für Fahrgäste bedeutet das kürzere Wartezeiten und zuverlässigere Abholungen; für Fahrerinnen, Fahrer und Plattformen bessere Fahrzeugauslastung und weniger Leerfahrten; und für Städte deutet es auf eine Zukunft hin, in der bestehende Straßen mehr Menschen mit weniger Fahrzeugen und weniger Stau befördern können. Die Autoren schlagen vor, dass ähnliche graphbasierte Multi-Agenten-Ideen schließlich auf andere Dienste ausgedehnt werden könnten, von autonomen Taxi-Flotten bis hin zur Notfallversorgung, und so einen geordneten Umgang mit den komplexen, sich wandelnden Strömen des modernen urbanen Lebens ermöglichen.

Zitation: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Schlüsselwörter: Ride-Sharing-Dispo, Multi-Agenten-Verstärkungslernen, Graphneurale Netze, städtische Mobilität, dynamisches Matching