Clear Sky Science · pl

Algorytm wieloagentowego uczenia ze wzmocnieniem do harmonogramowania integrujący modelowanie strukturalne grafu stanów i grafu zadań dla dyspozycji ride‑share

2026-01-17 · Powrót do spisu

Dlaczego inteligentniejsze ride‑sharing ma znaczenie dla życia w mieście

Każdy, kto zbyt długo czekał na przejazd z platformy przewozowej lub widział, jak puste pojazdy mijają zatłoczone rogi, przekonał się, jak trudne jest koordynowanie transportu miejskiego w czasie rzeczywistym. W tym badaniu prezentowany jest nowy system dyspozycji oparty na sztucznej inteligencji, zaprojektowany tak, by szybciej i efektywniej łączyć pasażerów z pojazdami współdzielonymi, zmniejszając zbędne przebiegi i skracając czas oczekiwania w gęstym, dynamicznie zmieniającym się ruchu miejskim.

Od prostych dopasowań do splecionego ruchu miejskiego

Ride‑hailing zaczynał od prostej idei: jeden kierowca, jeden pasażer, jedna podróż. Dziś ulice miast wyglądają zupełnie inaczej. Platformy zarządzają tysiącami pojazdów i pasażerów jednocześnie, często łącząc kilku podróżnych w jednym samochodzie i kierując flotami po całych dzielnicach. Popyt jest nierównomierny—w centrum może być lawina zamówień, podczas gdy inna część miasta jest spokojna—i wszystko zmienia się z minuty na minutę. Tradycyjne reguły dyspozycyjne albo proste strategie „najbliższy samochód” zawodzą w takich warunkach, powodując długie oczekiwania, niskie wykorzystanie pojazdów i niepotrzebne objazdy. Rysunek

ilustruje, jak te systemy muszą ewoluować od prostych par jeden‑do‑jednego do złożonych relacji współdzielenia wielu do wielu.

Dwie powiązane mapy zamiast jednego zamazania

Autorzy proponują nowe podejście nazwane DualG‑MARL, które traktuje problem dyspozycji jako dwie nakładające się mapy. Jedna mapa opisuje pojazdy: gdzie się znajdują, ile mają miejsc oraz czy są wolne, czy już przewożą pasażerów. Druga mapa opisuje zgłoszenia przejazdów: kto chce podróżować, skąd, dokąd i kiedy. Każda mapa jest modelowana jako graf, w którym węzły reprezentują samochody lub zgłoszenia, a krawędzie łączą te elementy, które są bliskie przestrzennie i czasowo. Przechowując informacje o pojazdach i pasażerach w oddzielnych, lecz powiązanych grafach, system zachowuje strukturę każdej strony zamiast mieszać wszystko w jedną, nieczytelną całość.

Jak SI uczy się łączyć pasażerów z samochodami

Na wierzchu tych podwójnych grafów system wykorzystuje klasę metod uczenia maszynowego znanych jako wieloagentowe uczenie ze wzmocnieniem. Każdy pojazd jest traktowany jako niezależny decydent, czyli „agent”, który wybiera spośród pobliskich zgłoszeń. Agenci dzielą wspólny cel: skrócić czas oczekiwania, unikać nadmiernych objazdów i utrzymać pojazdy w produktywnej pracy. Model skanuje oba grafy, aby wydobyć wzorce, a następnie używa mechanizmu uwagi—narzędzia AI podkreślającego najistotniejsze połączenia—do powiązania odpowiednich samochodów i pasażerów między dwiema mapami. Aby decyzje były szybkie i stabilne, system nie rozważa każdej możliwej pary. Zamiast tego buduje listę kandydatów najwyższej klasy dla każdego pojazdu (zbiór Top‑K), filtrowaną regułami twardymi, takimi jak liczba miejsc, opóźnienie odbioru i akceptowalna długość objazdu. Centralny uczący ocenia, jak dobrze działa cała flota, podczas gdy poszczególne samochody w czasie rzeczywistym stosują proste zasady lokalne. Rysunek

pokazuje przepływ od grafów pojazdów i zadań przez moduł dopasowywania aż do ostatecznych przydziałów.

Testy systemu na rzeczywistych przejazdach z Nowego Jorku

Naukowcy przetestowali DualG‑MARL na dużych zestawach danych z Komisji Taksi i Limuzyn Nowego Jorku, koncentrując się na Manhattanie i Queens. Porównali swoją metodę z szeregiem istniejących podejść, w tym regułami ręcznie opracowanymi, optymalizacją matematyczną oraz zaawansowanymi dyspozytorami opartymi na uczeniu, takimi jak CoopRide. W obu dzielnicach nowy system ustanowił nowe standardy w czterech kluczowych miarach: skrócił średni czas oczekiwania pasażerów na odbiór, zwiększył odsetek obsłużonych zgłoszeń, podniósł udział czasu, w którym pojazdy przewoziły klientów, oraz nieznacznie zmniejszył dodatkowy dystans spowodowany współdzieleniem przejazdów. Co ważne, te korzyści osiągnięto bez znaczącego wzrostu kosztów obliczeniowych: ograniczając uwagę do starannie wyselekcjonowanego zestawu obiecujących dopasowań, metoda pozostała wystarczająco szybka do użycia w czasie rzeczywistym.

Co to oznacza dla codziennych pasażerów i miast

Mówiąc prosto, badanie pokazuje, że reprezentowanie systemu ride‑hailingowego miasta jako dwóch uporządkowanych sieci—jednej dla pojazdów i drugiej dla pasażerów—i pozwolenie im na interakcję poprzez starannie zaprojektowany proces uczenia może uczynić współdzielenie bardziej inteligentnym i responsywnym. Dla pasażerów oznacza to krótsze oczekiwania i bardziej niezawodne odbiory; dla kierowców i platform lepsze wykorzystanie pojazdów i mniej pustych przebiegów; a dla miast sugeruje to przyszłość, w której istniejące drogi mogą przewozić więcej osób mniejszą liczbą samochodów i przy mniejszym zatłoczeniu. Autorzy sugerują, że podobne podejścia oparte na grafach i wieloagentowości mogłyby ostatecznie rozszerzyć się na inne usługi, od autonomicznych flot taxi po ratownictwo, oferując bardziej uporządkowany sposób zarządzania złożonymi, zmieniającymi się przepływami współczesnego życia miejskiego.

Cytowanie: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Słowa kluczowe: dyspozycja ride‑sharing, wieloagentowe uczenie ze wzmocnieniem, grafowe sieci neuronowe, mobilność miejska, dynamiczne dopasowywanie