Clear Sky Science · nl

Prestatieoptimalisatie op basis van soft actor critic voor IRS-ondersteunde cognitieve radiosystemen

· Terug naar het overzicht

Slimmere radiogolven voor een druk draadloos ecosysteem

Onze telefoons, sensoren en slimme woningen concurreren allemaal om dezelfde onzichtbare hulpbron: radiogolven. Naarmate meer apparaten verbinding maken, wordt het belangrijker om extra prestaties uit een beperkt spectrum te halen. Dit artikel onderzoekt een nieuwe manier om de datarates van gebruikers met lage prioriteit te verhogen zonder gebruikers met hoge prioriteit te schaden, door “slimme wanden” die radiogolven buigen te combineren met een kunstmatige-intelligentie leer-methode die het netwerk leert hoe het zichzelf moet configureren.

Figure 1
Figuur 1.

Delen zonder de buren te overstemmen

Moderne draadloze systemen gebruiken vaak een model met een “primaire” en een “secundaire” gebruiker. Primaire gebruikers, zoals gelicentieerde diensten, hebben prioritaire toegang tot bepaalde frequenties. Secundaire gebruikers mogen dezelfde kanalen hergebruiken, maar alleen als zij hun interferentie onder strikte limieten houden. Dit is het kernidee achter cognitieve radio: radio’s die hun omgeving waarnemen en zich aanpassen zodat spectrum efficiënter wordt gebruikt. De uitdaging is secundaire gebruikers goede datarates te geven terwijl ze vrijwel onzichtbaar blijven voor primaire gebruikers. Traditionele benaderingen vertrouwen alleen op slimme signaalverwerking op het basestation, wat snel complex wordt naarmate netwerken dichter worden en er meer antennes bijkomen.

Signaleng leidt met intelligente reflecterende oppervlakken

De auteurs voegen een krachtig nieuw hulpmiddel toe: intelligente reflecterende oppervlakken. Dit zijn dunne panelen bestaande uit vele kleine passieve elementen die kunnen aanpassen hoe ze binnenkomende radiogolven reflecteren, als een wand van regelbare spiegels voor draadloze signalen. Door zorgvuldig het reflectiepatroon te kiezen, kan het oppervlak energie naar de beoogde secundaire gebruiker sturen en weg van primaire ontvangers, waardoor de prestatie verbetert zonder extra zendvermogen te gebruiken. Het artikel analyseert een systeem waarin een basestation met veel antennes secundaire gebruikers bedient, terwijl meerdere reflecterende panelen helpen de paden die signalen door de omgeving afleggen te vormen, onder realistische millimetergolf-propagatiecondities.

Het netwerk leren zichzelf af te stemmen

Het vinden van de beste combinatie van basestation zendpatronen, zendvermogen en miljoenen kleine reflectie-instellingen is een rommelig wiskundig probleem. Klassieke optimalisatiemethoden, zoals block coordinate descent, pakken het aan door afwisselend tussen groepen variabelen te optimaliseren. Deze werken, maar worden traag en onhandelbaar naarmate oppervlakken groter worden of de omgeving verandert. In plaats daarvan formuleren de auteurs de taak als een leerprobleem voor een deep reinforcement learning-agent met het soft actor-critic (SAC) algoritme. In deze opzet observeert de agent de huidige kanaalcondities, vorige reflectiefases en het zendvermogen, en stelt vervolgens nieuwe reflectie-instellingen voor. Hij ontvangt een beloning die grotendeels gebaseerd is op de behaalde datarate van de secundaire gebruiker, mits de interferentie naar primaire gebruikers onder een toegestane drempel blijft. Na vele gesimuleerde interacties leert de agent een beleid dat observaties direct omzet in bijna-optimale configuraties.

Figure 2
Figuur 2.

Resultaten in simulatie en hardware

Door uitgebreide simulaties wordt de op SAC gebaseerde controller vergeleken met een traditionele block coordinate descent-referentie op meerdere punten: haalbare datarate voor secundaire gebruikers, invloed van het aantal reflecterende elementen en panelen, zendvermogenlimieten en interferentie-eisen. Het aangeleerde beleid evenaart of overtreft consequent de referentie in datarate, vooral wanneer intelligente oppervlakken veel elementen hebben, en vereist veel minder iteratieve berekening zodra de training is voltooid. De studie beoordeelt ook de runtime: bij kleine oppervlakken kunnen klassieke methoden iets sneller zijn, maar naarmate de systeemgrootte toeneemt schaalt de leergebaseerde aanpak beter. Ter ondersteuning van praktische inzet ontwerpen, fabriceren en testen de auteurs bovendien een 16-element basestation-antennearray die werkt van 3 tot 7 GHz. Metingen tonen goede matching, lage correlatie tussen antennes en ongeveer 90% stralingsefficiëntie, wat bevestigt dat het hardwareplatform veeleisende multi-antennewerking kan ondersteunen.

Wat dit betekent voor toekomstige draadloze netwerken

In simpele termen laat dit werk zien hoe het combineren van slimme reflecterende panelen met een leeralgoritme toestaat dat apparaten met lagere prioriteit actiever spectrum delen zonder prioritaire diensten te storen. In plaats van handgemaakte formules leert het netwerk zelf hoe het zijn signalen moet richten en vormen, zelfs in complexe omgevingen met veel regelbare elementen. Naarmate draadloze systemen zich ontwikkelen voorbij 5G, kunnen benaderingen als deze bijdragen aan hogere datarates, betere dekking en efficiënter gebruik van schaars spectrum, terwijl interferentie onder controle blijft.

Bronvermelding: Ghallab, R., Abdrabo, A. & Elashry, I. Soft actor critic-based performance optimization for IRS-aided cognitive radio systems. Sci Rep 16, 14283 (2026). https://doi.org/10.1038/s41598-026-49465-4

Trefwoorden: cognitieve radio, intelligente reflecterende oppervlakken, deep reinforcement learning, draadloze spectrumdeling, soft actor critic