Clear Sky Science · sv

En schemaläggningsalgoritm för multi-agent förstärkningsinlärning som integrerar tillstånds- och uppgiftsgrafers strukturella modellering för samåkningsdispatch

· Tillbaka till index

Varför smartare samåkning spelar roll för stadslivet

Den som suttit länge och väntat på en bokad bil eller sett tomma fordon köra förbi fulla hörn vet hur svårt det är att samordna stadstrafik i realtid. Denna studie presenterar ett nytt AI-baserat dispatchsystem avsett att matcha passagerare och samåkningsfordon snabbare och mer effektivt, minska onödig körsträcka och förkorta väntetider i tät, föränderlig stadstrafik.

Från enkla matchningar till invecklad stadstrafik

Bokningstjänster började med en enkel idé: en förare, en passagerare, en resa. Dagens gator ser annorlunda ut. Plattformar hanterar tusentals fordon och resenärer samtidigt, samlar ofta flera passagerare i samma bil och skickar fordon över hela stadsdelar. Efterfrågan är ojämn—centrala områden kan vara överbelastade medan andra delar är lugna—och allt förändras minut för minut. Traditionella regelbaserade dispatchmetoder eller enkla ”närmsta bil”-strategier har svårt i detta läge, vilket leder till långa väntetider, låg utnyttjandegrad och onödiga omvägar. Figur

Figure 1
Figure 1.
illustrerar hur dessa system måste utvecklas från enkla en-till-en-matchningar till komplexa många-till-många-delningsrelationer.

Två sammanlänkade kartor i stället för en enda oskarp bild

Författarna föreslår en ny ram kallad DualG-MARL som behandlar dispatchproblemet som två överlappande kartor. Den ena kartan beskriver fordonen: var de befinner sig, hur många platser de har och om de är lediga eller redan har passagerare. Den andra kartan beskriver resorna: vem vill åka, från var, till var och när. Varje karta modelleras som en graf där punkter representerar bilar eller förfrågningar och linjer kopplar ihop dem om de är nära varandra i tid och rum. Genom att hålla fordons- och passagerarinformation i separata men länkade grafer bevarar systemet strukturen på varje sida i stället för att blanda allt till en enda förvirrande bild.

Hur AI:n lär sig att matcha resenärer och fordon

På dessa tvillinggrafer använder systemet en klass av maskininlärningsmetoder som kallas multi-agent förstärkningsinlärning. Varje fordon behandlas som en självständig beslutsfattare, eller ”agent”, som väljer bland närliggande förfrågningar. Agenternas gemensamma mål är att minska väntetider, undvika alltför långa omvägar och hålla bilarna produktivt sysselsatta. Modellen skannar båda graferna för att extrahera mönster och använder en attention-mekanism—ett AI-verktyg som framhäver de mest relevanta kopplingarna—för att länka lämpliga bilar och resenärer över de två kartorna. För att hålla besluten snabba och stabila övervägs inte varje möjlig parning. Istället byggs en kortlista med de bästa kandidaterna för varje fordon (Top-K-setet), filtrerat med hårda regler som sittkapacitet, acceptabel upphämtningstid och maximal tillåten omväg. En centraliserad lärandeinstans utvärderar hur hela flottan presterar, medan enskilda bilar följer enkla lokala regler under realtidsdrift. Figur

Figure 2
Figure 2.
visar detta flöde från fordons- och uppgiftsgrafer genom matchningsmodulen till slutliga tilldelningar.

Test av systemet på verkliga resor i New York

Forskarna testade DualG-MARL på storskaliga reseuppgifter från New York Citys Taxi and Limousine Commission med fokus på Manhattan och Queens. De jämförde sin metod med en rad befintliga angreppssätt, inklusive handbyggda regler, matematisk optimering och avancerade inlärningsbaserade dispatchers som CoopRide. I båda stadsdelarna satte det nya systemet nya riktmärken på fyra viktiga mått: det förkortade den genomsnittliga väntetiden för passagerare, ökade andelen förfrågningar som faktiskt betjänades, höjde andelen tid fordonen bar kunder och minskade något den extra sträcka som delning orsakar. Viktigt är att dessa förbättringar kom utan stora ökningar i beräkningskostnader: genom att begränsa attention till ett kurerat urval av lovande matchningar höll sig metoden tillräckligt snabb för realtidsbruk.

Vad detta innebär för vardagliga resenärer och städer

Enkelt uttryckt visar studien att om man representerar en stads bokningssystem som två strukturerade nätverk—ett för fordon och ett för resenärer—och låter dem interagera genom en noggrant utformad inlärningsprocess kan samåkning bli smartare och mer responsiv. För passagerare innebär det kortare väntetider och mer pålitliga upphämtningar; för förare och plattformar innebär det bättre fordonsutnyttjande och mindre tomkörning; och för städer antyder det en framtid där befintliga vägar kan transportera fler människor med färre bilar och mindre trängsel. Författarna föreslår att liknande grafbaserade, multi-agentidéer så småningom kan utvidgas till andra tjänster, från autonoma taxiflottor till räddningsinsatser, och erbjuda ett mer ordnat sätt att hantera de komplexa, skiftande flödena i det moderna stadslivet.

Citering: Sha, J., Song, M., Sui, G. et al. A multi-agent reinforcement learning scheduling algorithm integrating state graph and task graph structural modeling for ride-sharing dispatching. Sci Rep 16, 5461 (2026). https://doi.org/10.1038/s41598-026-35004-8

Nyckelord: samåkning-dispatch, multi-agent förstärkningsinlärning, grafneuronätverk, stadsmobilitet, dynamisk matchning