Clear Sky Science · de
Indoor-Positionierung mit mehrdomänenbasierten CSI-Deep-Attention-Netzwerken für MIMO-Funksysteme
Sich in Innenräumen zurechtfinden
GPS leistet draußen hervorragende Dienste, doch in einem Einkaufszentrum, einer Fabrik oder einem Lager bricht seine Genauigkeit schnell zusammen. Viele neue Technologien – von Lagerrobotern und Lieferdrohnen bis hin zu Augmented‑Reality‑Brillen – müssen ihre Position in Innenräumen jedoch auf wenige Zentimeter genau kennen. Diese Arbeit untersucht, wie sich gewöhnliche Signale aus modernen Wi‑Fi‑ und Mobilfunknetzen mithilfe künstlicher Intelligenz in ein hochgenaues Instrument zur Innenraumortung verwandeln lassen.

Genau hinhören bei drahtlosen Echos
Wenn Ihr Telefon mit einer Basisstation kommuniziert, prallt das Signal an Wänden, Maschinen und Menschen ab, bevor es ankommt. Ingenieure erfassen ein detailliertes „Fingerabdruck“ dieser Reise, die sogenannte Channel State Information oder CSI. CSI beschreibt, wie sich Stärke, Zeitverhalten und Richtung des Signals auf dem Weg verändern. Moderne Massive‑MIMO‑Basisstationen, die Dutzende von Antennen nutzen, sammeln CSI im normalen Kommunikationsbetrieb – zusätzliche Signale oder Sensoren sind nicht erforderlich. Die Grundidee dieser Arbeit ist, diese reichen Fingerabdrücke auszuwerten, um exakt zu bestimmen, wo sich ein Gerät im Raum befindet.
Dasselbe Signal aus vielen Blickwinkeln betrachten
Die Autoren zeigen, dass CSI informativer wird, wenn man es aus mehreren Perspektiven betrachtet. Sie transformieren die Rohdaten in drei sich ergänzende „Domänen“. Eine Sicht hebt hervor, wie Signale sich über die Zeit ausbreiten und erfasst Echos und Verzögerungen. Eine zweite betont das Verhalten über verschiedene Funkfrequenzen. Eine dritte konzentriert sich auf Ankunftswinkel und zeigt, wie sich Energie über verschiedene Richtungen verteilt – ähnlich einem Scheinwerfermuster. Für jede Perspektive werden die Daten in zwei einfache mathematische Formen überführt, die grob der Zerlegung einer Welle in Amplitude und Phase entsprechen. Die Kombination all dieser Ansichten erzeugt eine mehrschichtige Beschreibung der Funkumgebung, die stark mit der Position des Nutzers verknüpft ist.
Neuronen beibringen, Aufmerksamkeit zu zeigen
Frühere Arbeiten setzten hauptsächlich auf Convolutional Neural Networks, eine Klasse von KI‑Modellen, die sich gut für Mustererkennung in Bildern eignen, um CSI zu verarbeiten. Diese Modelle behandeln jedoch alle Teile der Eingabe weitgehend gleich. In dieser Studie entwerfen die Forschenden eine neue Architektur, ein Deep‑Attention‑Netzwerk. Es verwendet weiterhin Faltungs‑ (Convolutional‑) Schichten zur Extraktion grundlegender Muster, ergänzt diese aber durch Attention‑Blöcke, die lernen, sich auf die informativsten Bereiche jeder CSI‑Sicht zu konzentrieren und die verschiedenen Sichten untereinander zu gewichten. Im Kern lernt das Netzwerk, welche Echos, Frequenzen und Winkel in einem überfüllten Innenraum am wichtigsten für die genaue Ortsbestimmung sind.

Genauigkeit und Geschwindigkeit testen
Das Team bewertet seinen Ansatz anhand eines öffentlichen Datensatzes, der in einem Labor aufgenommen wurde, das mit einer 64‑Antennen‑Basisstation ausgestattet ist und einen nur wenige Meter breiten Innenbereich in feinen räumlichen Schritten abtastet. Sie vergleichen verschiedene Kombinationen von CSI‑Sichten und Netzwerkarchitekturen. Die gleichzeitige Nutzung aller drei Domänen schlägt durchgängig die Verwendung einer einzelnen Domäne. Das Deep‑Attention‑Netzwerk erzielt die geringsten typischen Fehler, oft im Bereich von etwa zwei Zentimetern, und hält diese hohe Genauigkeit über unterschiedliche Antennenanordnungen und verschiedene Mengen an Trainingsdaten aufrecht. Dieser Vorteil hat jedoch seinen Preis: Das Attention‑Modell benötigt für die Verarbeitung der gleichen Anzahl von Proben in etwa doppelt so lange wie ein einfacheres Faltungsnetzwerk, da der Fokussierungsmechanismus zusätzliche Rechenarbeit verursacht.
Präzision und Praktikabilität ausbalancieren
Alltäglich gesprochen zeigt die Studie, dass sich bestehende fortschrittliche Funknetze in eine Art Innen‑„GPS“ mit Zentimetergenauigkeit verwandeln lassen, wenn KI mehrere Perspektiven darauf kombiniert, wie Radiowellen in einem Raum reflektieren. Das Deep‑Attention‑Netzwerk liefert die präzisesten Positionsschätzungen, benötigt dafür aber mehr Rechenleistung und Zeit und eignet sich daher besser für Anwendungen, bei denen Zuverlässigkeit und höchste Genauigkeit wichtiger sind als Reaktionszeiten im Millisekundenbereich. Zukünftige Arbeiten zielen darauf ab, diese Attention‑Mechanismen zu vereinfachen und in komplexeren, sich verändernden Innenräumen zu testen, um ultra‑präzise Innenraumortung näher an reale Einsätze zu bringen.
Zitation: Susarla, P., Mukherjee, A., Bulusu, S.S.K.C. et al. Indoor positioning with multi-domain CSI-based deep attention networks for MIMO wireless systems. npj Wirel. Technol. 2, 23 (2026). https://doi.org/10.1038/s44459-025-00021-y
Schlüsselwörter: Indoor-Positionierung, Massive MIMO, Channel State Information, Tiefes Lernen, Aufmerksamkeitsnetzwerke