Clear Sky Science · de

Tiefes Reinforcement Learning zur Optimierung von Netzwerkressourcen in MIMO‑NOMA‑Netzen zur Maximierung der Auslastung bei minimalem Overhead

2026-03-09 · Zurück zur Übersicht

Warum intelligentere Mobilfunknetze wichtig sind

Während unsere Telefone, Autos und zahllose Sensoren um drahtlose Bandbreite konkurrieren, tun sich heutige Netze schwer, alle zuverlässig und reibungslos verbunden zu halten — besonders wenn sich Nutzer schnell durch Städte oder auf Autobahnen bewegen. Diese Arbeit stellt eine neue Methode vor, um künftige 5G‑ und 6G‑ähnliche Netze deutlich effizienter und zuverlässiger zu machen, indem das Netz in Echtzeit lernt, welche Verbindungen zu nutzen sind und wie begrenzte Funkressourcen unter vielen Nutzern mit minimalem Verschleiß geteilt werden können.

Überlastete Funkbänder und das Problem der Verdrängung

Moderne drahtlose Systeme müssen eine große Zahl beweglicher Nutzer bedienen. Neue Technologien wie MIMO, die viele Antennen gleichzeitig nutzen, und NOMA, die mehreren Nutzern das Teilen desselben Spektrums erlauben, versprechen erhebliche Kapazitätsgewinne. In der Praxis aber, wenn Menschen mit dem Auto oder Zug unterwegs sind und die Signale stark schwanken, wird es sehr schwierig zu entscheiden, mit welcher Basisstation jeder Nutzer verbunden werden soll, wie viel Leistung zugewiesen wird und wie Interferenzen zwischen Nutzern verhindert werden können. Viele bestehende Optimierungsverfahren gehen von relativ stabilen Bedingungen oder perfektem Kanalwissen aus — Annahmen, die in schnellen, überfüllten Realwelt‑Szenarien nicht mehr gelten.

Das Netz vorhersagen lassen, welche Verbindung am besten ist

Die Autoren schlagen einen Ansatz namens OSIANRO vor, der damit beginnt, die Zuweisung von Endgeräten zu Netzen und Kanälen zu verbessern. Anstatt sich auf feste Regeln zu stützen, verwendet er eine verstärkte Version einer verbreiteten Machine‑Learning‑Methode, bekannt als Gradient Boosting. Dieses verbesserte Modell lernt aus vielen Beispielen früherer Netzverhalten — etwa Signalstärke, Verzögerung und die Art der genutzten Anwendung — um vorherzusagen, ob eine bestimmte Verbindungswahl voraussichtlich erfolgreich sein wird. Die Methode wird mathematisch so angepasst, dass zu komplexe Entscheidungen bestraft und seltene, aber wichtige Problemfälle — etwa schwer zu versorgende Nutzer — behandelt werden. Durch sorgfältiges Bewerten und Rängen der wichtigsten Informationen konzentriert sie sich nur auf die nützlichsten Merkmale und reduziert so Entscheidungszeit und Fehler.

Dem Netz beibringen, fair zu teilen und Kollisionen zu vermeiden

Sobald OSIANRO eine vielversprechende Funkzelle oder einen Kanal ausgewählt hat, muss es entscheiden, wie Spektrum und Leistung unter vielen Nutzern aufgeteilt werden. Die Autoren entwickeln ein detailliertes mathematisches Modell, das beschreibt, wie viel Daten Nutzer senden können, wie Signale sich gegenseitig stören und wie häufig Kollisionen auftreten, wenn Nutzer gleichzeitig das Funkband nutzen wollen. Anstatt dieses komplexe Problem mit festen Formeln zu lösen, nutzt das System tiefes Reinforcement Learning, bei dem viele Software‑»Agenten« durch Versuch und Irrtum lernen. Jeder Agent repräsentiert einen Nutzer, der auswählt, welchen Ressourcenblock er ansteuert und wie aggressiv er konkurriert. Die Agenten erhalten Belohnungen, wenn die Gesamtdatenraten steigen, und Strafen, wenn Interferenz oder Kanal‑Overhead zunehmen, und konvergieren so langsam zu Strategien, die Kollisionen gering halten und gleichzeitig den Gesamtdurchsatz erhöhen.

Leistung in Stadtstraßen und auf Autobahnen

Zur Bewertung von OSIANRO simulieren die Autoren realistische Stadt‑ und Autobahn‑Szenarien unter Verwendung bekannter Kanalmodelle und Open‑Source‑Werkzeuge. Sie vergleichen ihr System mit einer fortschrittlichen Referenz, die ein spezialisiertes, quanteninspiriertes Gerät zur Ressourcenoptimierung nutzt. In zahlreichen Experimenten erhöht OSIANRO durchgängig die Gesamtdatenrate, gewinnt mehr Informationen pro Spektrumeinheit und reduziert die Anzahl von Kollisionen deutlich — selbst bei steigender Nutzerzahl und höheren Geschwindigkeiten. Die verbesserte gradient‑gestärkte Netzauswahl erweist sich als genauer und schneller als Standardversionen, während die Reinforcement‑Learning‑Komponente sich flexibel an veränderliche Funkbedingungen anpasst, ohne auf perfektes Vorwissen angewiesen zu sein.

Was das für die tägliche Konnektivität bedeutet

Vereinfacht zeigt die Arbeit, dass die Fähigkeit von Funknetzen, selbstständig zu prognostizieren und zu lernen, überfüllte Funkbänder eher wie gut organisierte Autobahnen als wie chaotische Parkplätze funktionieren lassen kann. Durch intelligente Auswahl der passenden Funkzelle und des Kanals für jedes Gerät und durch kontinuierliche Anpassung, wie Nutzer das Spektrum teilen, liefert OSIANRO mehr Daten an mehr Nutzer mit weniger Verzögerungen und Störungen. Obwohl die Ergebnisse aus detaillierten Simulationen und nicht aus Live‑Einsätzen stammen, deuten sie auf einen praktischen Weg hin zu Mobilnetzen, die schnell, fair und stabil bleiben — selbst wenn sie mit fahrenden Autos, Zügen und Milliarden verbundener Geräte gefüllt sind.

Zitation: Lahza, H., Sreenivasa, B.R., Lahza, H. et al. Deep reinforcement learning for network resource optimization in MIMO-NOMA networks to maximize utilization with minimal overhead. Sci Rep 16, 12635 (2026). https://doi.org/10.1038/s41598-026-42953-7

Schlüsselwörter: 5G Ressourcenallokation, MIMO NOMA, tiefes Reinforcement Learning, Netzwerkoptimierung, kabellose Interferenz