Clear Sky Science · pl

Zastosowanie sieci konwolucyjnej czasowo-szeregowej sprzężonej z modułem atencji kanałowej do lokalizacji wewnątrz budynków przy użyciu UWB

· Powrót do spisu

Dlaczego znajdowanie ludzi w pomieszczeniach jest tak trudne

Smartfony, roboty i roboty magazynowe muszą dokładnie wiedzieć, gdzie się znajdują, nawet gdy satelity GPS nie docierają do wnętrz budynków. Radiotechnologia ultraszerokopasmowa (UWB) stała się wiodącym kandydatem do tego zadania, ponieważ potrafi mierzyć odległości z dokładnością rzędu centymetrów. Jednak w zatłoczonych, realnych przestrzeniach pełnych ścian, szyb i poruszających się osób sygnały radiowe często odbijają się, załamują lub są chwilowo blokowane, co powoduje nagłe skoki w raportowanej pozycji. Artykuł opisuje nową metodę opartą na sztucznej inteligencji, która czyni pozycjonowanie UWB znacznie dokładniejszym i bardziej stabilnym w takich złożonych środowiskach wewnętrznych.

Figure 1
Figure 1.

Pulsy radiowe w zatłoczonym pomieszczeniu

Systemy UWB lokalizują urządzenie, zwane tagiem, mierząc, ile czasu zajmuje bardzo krótkim impulsom radiowym przebycie drogi między tagiem a kilkoma stałymi stacjami bazowymi. W prostych, otwartych przestrzeniach podejście oparte na „czasie przybycia” działa dobrze. W pomieszczeniach sygnały często jednak podążają drogami pośrednimi — odbijając się od drzwi, okien i ludzi — zanim dotrą do odbiornika. Takie trasy poza polem widzenia (NLOS) sprawiają, że tag wydaje się być dalej, niż jest w rzeczywistości. Tradycyjne poprawki opierają się na starannie dobranych filtrach matematycznych lub narzędziach uczenia maszynowego, które najpierw próbują oznaczyć każdy sygnał jako czysty lub zniekształcony. Choć pomocne, metody te albo silnie zależą od strojenia przez ekspertów, albo nadal mają problemy, gdy ludzie poruszają się w nieprzewidywalny sposób po przestrzeni.

Pozwolić danym opowiedzieć historię w czasie

Naukowcy proponują inną strategię: zamiast traktować każde odczytanie odległości w izolacji, analizują, jak odczyty zmieniają się w czasie i pozwalają modelowi uczenia głębokiego nauczyć się tych wzorców. Ich podstawowe narzędzie to czasowo-konwolucyjna sieć (TCN), rodzaj sieci neuronowej zaprojektowanej do danych szeregów czasowych. W przeciwieństwie do sieci rekurencyjnych, które przetwarzają moment po momencie, TCN używają konwolucji jednowymiarowych, które mogą równolegle analizować długie fragmenty historii. Taka konstrukcja unika typowych problemów treningowych i pozwala modelowi dostrzec subtelne, długoterminowe trendy — na przykład jak osoba przechodząca między tagiem a stacją bazową chwilowo wydłuża zmierzoną odległość, a potem pozwala jej wrócić do poprzedniej wartości.

Nauczyć sieć, na co zwracać uwagę

Na szczycie TCN zespół dodaje moduł atencji kanałowej (CAM). Każda stacja bazowa generuje własny strumień odczytów odległości i nie wszystkie są w równym stopniu wiarygodne w danym momencie. CAM uczy się przypisywać różne wagi tym strumieniom, wzmacniając te, które wydają się spójne, i przyciszając te, które wyglądają na zniekształcone przez odbicia lub blokady. Razem połączona sieć TCN‑CAM przyjmuje surowe, zaszumione odległości z sześciu stacji bazowych i zwraca najlepsze oszacowanie trójwymiarowych współrzędnych tagu — wszystko w jednym kroku end‑to‑end, bez oddzielnego etapu klasyfikacji sygnałów.

Figure 2
Figure 2.

Testy w symulowanym szumie i na prawdziwych korytarzach

Aby sprawdzić skuteczność metody, autorzy najpierw stworzyli tysiące wirtualnych pozycji wewnątrz budynków i zasymulowali pomiary UWB z różnymi poziomami dodanego szumu i błędów NLOS. Porównali swoje podejście TCN‑CAM z trzema konkurentami: siecią LSTM z mechanizmem atencji, standardową TCN i siecią konwolucyjną z atencją kanałową. Wraz ze wzrostem symulowanych zakłóceń błędy rosły dla wszystkich metod, ale TCN‑CAM konsekwentnie dawała najmniejsze błędy i najwęższe rozkłady wyników, co świadczy zarówno o wyższej dokładności, jak i większej niezawodności. W najtrudniejszych warunkach testowych zmniejszała średnie błędy pozycji o około jedną czwartą do połowy w porównaniu z innymi metodami.

Z laboratorium do rzeczywistego ruchu

Zespół następnie przeszedł do rzeczywistego testu w pomieszczeniu wyposażonym w sześć stacji bazowych UWB, precyzyjny instrument geodezyjny oraz osoby chodzące wokół, aby celowo powodować blokady sygnału. Nowy algorytm lokalizował poruszający się tag z przeciętnym błędem wynoszącym zaledwie 3,32 centymetra. To o około 19% lepiej niż zwykła TCN, 25% lepiej niż model konwolucyjny z atencją oraz imponujące 76% lepiej niż podejście oparte na LSTM. Wyniki TCN‑CAM nie tylko skupiają się ciaśniej wokół prawdziwej ścieżki, lecz także wierniej śledzą rzeczywistą trójwymiarową trajektorię tagu we wszystkich kierunkach.

Co to oznacza dla technologii codziennego użytku

Dla osób niebędących specjalistami wniosek jest prosty: pozwalając inteligentnemu modelowi obserwować, jak odczyty odległości UWB zmieniają się w czasie i uczyć się, którym sygnałom ufać w danym momencie, pozycjonowanie wewnątrz budynków może stać się znacznie dokładniejsze i mniej podatne na skoki, nawet gdy ludzie poruszają się i blokują drogę radiową. Choć metoda wymaga ponownego treningu po przesunięciu stałych stacji bazowych, oferuje potężne i praktyczne rozwiązanie dla fabryk, szpitali, magazynów i inteligentnych budynków, w których infrastruktura pozostaje na miejscu. W miarę jak podobne techniki uczenia głębokiego dojrzewają i zaczynają łączyć UWB z innymi czujnikami, urządzenia wewnątrz budynków mogą wkrótce znać swoje położenie niemal tak niezawodnie, jak twój telefon na zewnątrz.

Cytowanie: He, L., Lian, Z., Núñez-Andrés, M.A. et al. Application of a temporal convolutional network algorithm fused with channel attention module for UWB indoor positioning. Sci Rep 16, 6305 (2026). https://doi.org/10.1038/s41598-026-35802-0

Słowa kluczowe: lokalizacja wewnątrz budynków, ultraszerokopasmowy, uczenie głębokie, analiza szeregów czasowych, śledzenie pozycji