Clear Sky Science · nl

Op een reinforcement-learning gebaseerde middelenallocatieschema voor voertuigcommunicatie in 5G-netwerken voor slimme steden

· Terug naar het overzicht

Waarom slimme verkeerssystemen slimme vermogensregeling nodig hebben

Naarmate steden volstromen met verbonden auto’s, telefoons en wegmeeteenheden, verbruikt al dat draadloze verkeer ongemerkt veel elektriciteit. De netwerken waarmee voertuigen met elkaar en met verkeerslichten communiceren moeten snel en betrouwbaar zijn, maar ook zuinig met energie als we schoner en groener vervoer willen. Deze studie onderzoekt hoe een eenvoudig soort leerprogramma auto’s kan helpen automatisch precies de juiste hoeveelheid radiosignaal te kiezen, waardoor verspilling afneemt terwijl cruciale veiligheidberichten blijven stromen.

Figure 1. Hoe verbonden auto’s en 5G-straatapparaten gegevens delen met minder energieverbruik in een slimme stad.
Figure 1. Hoe verbonden auto’s en 5G-straatapparaten gegevens delen met minder energieverbruik in een slimme stad.

Auto’s die leren hoe hard ze moeten “spreken”

Het werk richt zich op Vehicle-to-Everything-verbindingen, waarbij auto’s informatie delen met andere auto’s, voetgangers, wegapparatuur en het bredere netwerk via 5G. In drukke straten kaatsen signalen tegen gebouwen, bewegen voertuigen snel en verandert de kwaliteit van de draadloze verbinding van moment tot moment. Traditioneel worden vermogensniveaus ingesteld met vaste regels of gecentraliseerde planners die moeite hebben dit voortdurende bewegingsbeeld bij te houden. Hier draait elk voertuig in plaats daarvan een kleine leeragent die zijn omgeving observeert, een zendvermogen kiest en daarna leert van de uitkomsten.

Hoe leren het energiegebruik stuurt

De auteurs bouwen voort op een methode die Q-learning heet, gekozen omdat die licht genoeg is om op elektronica in een auto te draaien. De agent kijkt naar eenvoudige metingen zoals hoe sterk het signaal is ten opzichte van storing, hoe ver het van de ontvanger is en hoe druk de weg is. Voor elke situatie probeert hij verschillende vermogensinstellingen en ontvangt een numerieke beloning die twee doelen afweegt: data snel en duidelijk verzenden, maar zo min mogelijk energie gebruiken. Over vele proeven vult de agent een kleine tabel die elke situatie koppelt aan een goede keuze van vermogen, en convergeert geleidelijk naar een beleidsregel die goed werkt zonder een grote processor of een gedetailleerd netwerkmodel te vereisen.

Werken onder rommelige, stedelijke omstandigheden

Om het idee te testen simuleren de onderzoekers een druk stedelijk kruispunt met voertuigen, voetgangers, wegunits en 5G-basisstations. Het model omvat effecten uit de echte wereld zoals signaalverlies met afstand, reflecties van gebouwen en Doppler-verschuivingen door bewegende auto’s. De leeragent begint vrijwel willekeurig te verkennen, waardoor zijn energie-efficiëntie en datakwaliteit van de ene trainingsrun op de andere sterk schommelen. Met ervaring stabiliseert zijn gedrag echter: hij kiest vaak matige vermogensniveaus die het signaal sterk genoeg houden voor veiligheidsberichten maar vermijden dat de ether wordt geblazen. De simulaties tonen aan dat de energie-efficiëntie piekt bij bepaalde afstanden en signaalkwaliteitsniveaus en vervolgens afneemt wanneer verbindingen te lang worden en onnodig hoog vermogen zouden vereisen.

Eenvoudige software voor robuuste, lokale controle

Een belangrijke kracht van de aanpak is dat elk voertuig zelfstandig leert met alleen lokale informatie. Als een wegunit uitvalt of dekking tijdelijk verzwakt, merkt de auto dat de linkkwaliteit is gedaald en experimenteert hij met alternatieve vermogenskeuzes om de prestaties te herstellen. Omdat de leertabel klein is, is de methode praktisch voor ingebedde hardware en kan ze snel reageren op veranderende verkeers- en kanaalomstandigheden. De studie bekijkt ook hoe onvolmaakte metingen van het radiokanaal na verloop van tijd toch uitmiddelen, waardoor de agent stabiele, verstandige strategieën kan vinden zonder een perfect beeld van het netwerk.

Figure 2. Hoe een auto stap voor stap leert zijn draadloze zendvermogen aan te passen om energie te besparen maar een sterke verbinding te behouden.
Figure 2. Hoe een auto stap voor stap leert zijn draadloze zendvermogen aan te passen om energie te besparen maar een sterke verbinding te behouden.

Wat dit betekent voor toekomstige straten

Voor alledaagse weggebruikers is de boodschap dat dezelfde intelligentie die auto’s veiliger maakt, ze ook milder voor het stroomnet kan maken. Door elk voertuig te laten leren hoe luid het over de lucht moet spreken, laat dit werk een route zien naar draadloze systemen die minder energie verspillen terwijl ze toch de snelle, betrouwbare verbindingen leveren die nodig zijn voor botsingswaarschuwingen en andere tijdkritische diensten. De auteurs suggereren dat toekomstige uitbreidingen met meerdere samenwerkende voertuigen en gedeeld leren verder kunnen verbeteren hoe het radiospectrum wordt benut in drukke stadsstraten.

Bronvermelding: Brindha, S., Nasreen, P.P.S., Sagar, P. et al. Reinforcement learning based resource allocation scheme for vehicular communication in 5G networks for smart cities. Sci Rep 16, 15807 (2026). https://doi.org/10.1038/s41598-026-45209-6

Trefwoorden: 5G V2X, slimme steden, reinforcement learning, energie-efficiëntie, voertuigcommunicatie