Clear Sky Science · pl

Optymalizacja wydajności oparta na soft actor critic dla systemów radiowych wspomaganych przez IRS

2026-05-05 · Powrót do spisu

Inteligentniejsze pasma dla zatłoczonego świata bezprzewodowego

Nasze telefony, czujniki i inteligentne domy konkurują o ten sam niewidzialny zasób: fale radiowe. Wraz ze wzrostem liczby podłączonych urządzeń, wyciskanie dodatkowej wydajności z ograniczonego widma staje się kluczowe. W artykule przedstawiono nowy sposób zwiększenia przepustowości użytkowników o niższym priorytecie bez szkody dla tych o wyższym priorytecie — poprzez połączenie „inteligentnych ścian”, które załamują fale radiowe, z metodą uczenia maszynowego, która uczy sieć, jak się konfigurować.

Współdzielenie bez zakłócania sąsiadów

Nowoczesne systemy bezprzewodowe często operują w modelu użytkownika „pierwszorzędnego” i „wtórnego”. Użytkownicy pierwsi, tacy jak usługi z licencją, mają priorytetowy dostęp do określonych częstotliwości. Użytkownicy wtórni mogą współdzielić te same kanały tylko pod warunkiem, że ich interferencja mieści się w surowo określonych granicach. To jest istota radia kognitywnego: urządzeń, które wykrywają otoczenie i adaptują się, by widmo było wykorzystywane efektywniej. Wyzwaniem jest zapewnienie użytkownikom wtórnym dobrych przepustowości przy jednoczesnym pozostawaniu niemal niewidocznym dla użytkowników pierwotnych. Tradycyjne podejścia opierają się na zaawansowanym przetwarzaniu sygnału w stacji bazowej, co staje się szybko skomplikowane wraz ze wzrostem gęstości sieci i liczby anten.

Załamywanie sygnałów za pomocą inteligentnych powierzchni odbijających

Autorzy dodają do układu potężne nowe narzędzie: inteligentne powierzchnie odbijające. To cienkie panele z wieloma drobnymi, pasywnymi elementami, które mogą regulować sposób odbicia padających fal radiowych — jak ściana sterowalnych lusterek dla sygnałów bezprzewodowych. Poprzez staranny dobór wzoru odbicia powierzchnia może skierować energię do zamierzonego użytkownika wtórnego i z dala od odbiorników pierwotnych, poprawiając wydajność bez zwiększania mocy nadawczej. W pracy analizowany jest system, w którym stacja bazowa z wieloma antenami obsługuje użytkowników wtórnych, a kilka paneli odbijających kształtuje drogi, jakimi sygnały przechodzą przez otoczenie, w realistycznych warunkach propagacji w paśmie milimetrowym.

Nauka sieci samodzielnej regulacji

Znalezienie najlepszej kombinacji wzorów wiązek stacji bazowej, mocy nadawczej i milionów drobnych ustawień odbicia to złożony problem matematyczny. Klasyczne metody optymalizacji, takie jak block coordinate descent, rozwiązują go przez naprzemienne optymalizowanie jednych grup zmiennych względem innych. Działają one, lecz stają się powolne i nieporęczne w miarę powiększania powierzchni lub zmiany środowiska. Zamiast tego autorzy przedstawiają zadanie jako problem uczenia dla agenta głębokiego uczenia ze wzmocnieniem, używając algorytmu soft actor‑critic (SAC). W tym układzie agent obserwuje bieżące warunki kanału, poprzednie fazy odbicia oraz moc nadawczą, a następnie proponuje nowe ustawienia odbicia. Otrzymuje nagrodę opartą głównie na osiągniętej przepływności użytkownika wtórnego, pod warunkiem że interferencja wobec użytkowników pierwotnych pozostaje poniżej dozwolonego progu. W wielu symulowanych interakcjach agent uczy się polityki, która bezpośrednio mapuje obserwacje na konfiguracje bliskie optymalnym.

Wyniki w symulacji i na sprzęcie

Poprzez rozległe symulacje kontroler oparty na SAC porównano z klasycznym benchmarkiem block coordinate descent pod wieloma względami: osiągalną przepływnością dla użytkowników wtórnych, wpływem liczby elementów odbijających i paneli, ograniczeniami mocy nadawczej oraz ograniczeniami interferencji. Wyuczona polityka konsekwentnie dorównuje lub przewyższa benchmark pod względem przepustowości, zwłaszcza gdy powierzchnie inteligentne mają wiele elementów, przy znacznie mniejszym nakładzie obliczeń iteracyjnych po zakończeniu treningu. Badanie obejmuje także ocenę czasu działania: dla małych powierzchni metody klasyczne mogą być nieco szybsze, ale wraz ze wzrostem rozmiaru systemu podejście oparte na uczeniu skalowalnie wypada lepiej. Aby wesprzeć praktyczne wdrożenie, autorzy zaprojektowali, wykonali i przetestowali 16‑elementową macierz antenową stacji bazowej działającą w zakresie 3–7 GHz. Pomiary wykazują dobrą dopasowalność, niską korelację między antenami i około 90% sprawności promieniowania, potwierdzając, że platforma sprzętowa może wspierać wymagające operacje wieloantenowe.

Co to oznacza dla przyszłych sieci bezprzewodowych

Mówiąc obrazowo, praca pokazuje, jak połączenie inteligentnych paneli odbijających z algorytmem uczącym pozwala urządzeniom o niższym priorytecie agresywniej współdzielić widmo bez zakłócania usług o wyższym priorytecie. Zamiast ręcznie opracowanych formuł, sieć uczy się sama, jak celować i kształtować sygnały, nawet w złożonych środowiskach i przy wielu sterowalnych elementach. W miarę jak systemy bezprzewodowe ewoluują poza 5G, podejścia tego typu mogą pomagać dostarczać wyższe przepustowości, lepsze pokrycie i wydajniejsze wykorzystanie ograniczonego widma, przy jednoczesnym utrzymaniu kontroli nad interferencją.

Cytowanie: Ghallab, R., Abdrabo, A. & Elashry, I. Soft actor critic-based performance optimization for IRS-aided cognitive radio systems. Sci Rep 16, 14283 (2026). https://doi.org/10.1038/s41598-026-49465-4

Słowa kluczowe: radio kognitywne, inteligentne powierzchnie odbijające, głębokie uczenie wzmacniające, dzielenie widma bezprzewodowego, soft actor critic