Clear Sky Science · pl

Ultraefektywne obliczenia pól fizycznych przez kwantyzację sieci o wartościach zespolonych

· Powrót do spisu

Dlaczego zmniejszanie inteligentnych modeli ma znaczenie

Wiele niewidocznych technologii wokół nas — sieci bezprzewodowe, skanery medyczne i wyświetlacze holograficzne — opiera się na falach. Dokładne symulowanie i kontrolowanie tych fal jest kluczowe, ale z użyciem współczesnych narzędzi sztucznej inteligencji może być powolne i energochłonne. W tym badaniu pokazano, jak radykalnie zmniejszyć i przyspieszyć specjalną klasę modeli AI pracujących bezpośrednio z informacją falową, nie rezygnując przy tym ze szczegółów niezbędnych do ostrych obrazów i wiarygodnych sygnałów.

Figure 1
Figure 1.

Fale, liczby i ukryta struktura

Światło, dźwięk i fale radiowe niosą dwie informacje: ich natężenie oraz to, jak maksima są względem siebie przesunięte w przestrzeni i czasie. Matematycy łączą te cechy w „liczby zespolone”, które naturalnie opisują zjawiska takie jak interferencja i drgania. Sieci neuronowe o wartościach zespolonych wykorzystują to, operując bezpośrednio na tych sparowanych wielkościach, co czyni je potężnymi narzędziami do zadań od generowania hologramów po analizę radaru i akustyki. Jest jednak haczyk: uruchamianie takich modeli z pełną precyzją numeryczną jest kosztowne pod względem pamięci, obliczeń i energii, co ogranicza ich zastosowanie w urządzeniach przenośnych i systemach czasu rzeczywistego.

Dlaczego standardowe skróty niszczą informację falową

Popularnym sposobem odchudzania modeli AI jest kwantyzacja — przechowywanie wag i aktywacji przy użyciu zaledwie kilku bitów zamiast liczb o pełnej precyzji. Dla zwykłych, rzeczywistych sieci działa to bardzo dobrze. Jednak większość istniejących metod traktuje części rzeczywistą i urojoną liczb zespolonych jak niepowiązane kanały. Ignoruje to ścisłe powiązanie między natężeniem a fazą w systemach opartych na falach. W efekcie błędy zaokrągleń w każdej części przestają się niwelować lub synchronizować, zaburzając delikatne relacje fazowe decydujące o tym, jak fale się sumują lub znoszą. W praktyce może to wprowadzać niefizyczny szum, rozmywać holograficzne obrazy i pogarszać działanie systemów takich jak radar z syntetyczną aperturą.

Mądrzejszy sposób zaokrąglania zespolonych fal

Autorzy proponują nową strategię, która utrzymuje „świadomość” obydwu składowych liczby zespolonej podczas kompresji. Ich ramy wspólnie kwantyzują części rzeczywistą i urojoną tak, aby błędy zaokrągleń były kształtowane w sposób zachowujący zarówno amplitudę, jak i kierunek złożonej wartości zespolonej. Wprowadzają też adaptacyjny schemat, który decyduje, warstwa po warstwie, ile bitów jest faktycznie potrzebnych. Warstwy bezpośrednio operujące na fizycznych polach falowych zachowują wyższą precyzję, podczas gdy głębsze warstwy pracujące na bardziej abstrakcyjnych cechach mogą bezpiecznie używać mniejszej liczby bitów. Procedura treningowa w dwóch etapach najpierw uczy optymalny wzorzec szerokości bitowej w sieci, a następnie retrenuje model przy użyciu tych wyborów, aby odzyskać dokładność.

Figure 2
Figure 2.

Bardziej ostre hologramy przy ułamku kosztu

Aby przetestować swoją koncepcję, zespół zbudował ultra-niskobitową sieć dla komputerowo generowanej holografii, aplikacji niezwykle wrażliwej, gdzie drobne błędy numeryczne mogą powodować ziarnistość i artefakty. Ich projekt zawiera generator fazy, moduł konwertujący zespolone pola falowe na hologramy tylko fazowe oraz kompensator zmniejszający efekty dzwonienia wynikające z niedoskonałych modeli optycznych. Trenowana z funkcją straty oceniającą propagowane pole światła, a nie tylko różnice pikselowe, sieć bezpośrednio karze błędy istotne w realnym układzie optycznym. W porównaniu z wiodącą siecią holograficzną o nazwie HoloNet, nowy model generuje rekonstrukcje wyższej jakości — około 4 decybele lepiej w standardowej miarze jakości obrazu — przy jednoczesnym zmniejszeniu obliczeń o około 99 procent i zużycia pamięci prawie o trzy rzędy wielkości. Doświadczenia optyczne z hologramami dwuwymiarowymi i trójwymiarowymi potwierdzają, że skompresowany model nadal dostarcza czyste obrazy z redukcją speckli w warunkach laboratoryjnych.

Poza hologramami: dźwięk, bezprzewodowość i radar

Korzyści nie ograniczają się do optyki. Autorzy testują swoje skwantyzowane sieci zespolone na trzech innych zadaniach opartych na falach: rozpoznawaniu mówców na podstawie sygnałów audio, klasyfikacji trybów modulacji w łączności bezprzewodowej oraz identyfikacji celów w danych z radaru z syntetyczną aperturą. W każdym z przypadków skwantyzowany model zespolony osiąga dokładność bliską, a czasami lepszą od bazowych modeli z pełną precyzją, jednocześnie ograniczając liczbę operacji bitowych i zapotrzebowanie na pamięć o około 80–90 procent. Zarówno na procesorach stacjonarnych, jak i na smartfonie z Androidem podejście daje duże przyspieszenia w porównaniu z wcześniejszymi sieciami do holografii, pokazując, że zaawansowane modele AI oparte na falach mogą działać wydajnie na krawędzi sieci, a nie tylko w potężnych centrach danych.

Co to oznacza dla przyszłych technologii falowych

Szanując specjalną strukturę liczb zespolonych zamiast traktować ich składowe oddzielnie, ta praca oferuje praktyczny przepis na budowę lekkich, efektywnych narzędzi AI, które nadal respektują fizykę fal. Proponowany schemat kwantyzacji pozwala sieciom o wartościach zespolonych zachować subtelną informację fazową będącą podstawą ostrych hologramów, czystego dźwięku, niezawodnych łączy bezprzewodowych i precyzyjnych obrazów radarowych, jednocześnie drastycznie redukując ich ślad obliczeniowy. W efekcie obliczenia pól fizycznych o wysokiej wierności stają się bardziej zgodne z urządzeniami mobilnymi i systemami wbudowanymi, otwierając drogę do przenośnych wyświetlaczy holograficznych, inteligentniejszych czujników i energooszczędnych instrumentów naukowych opartych na falach.

Cytowanie: Geng, Z., Li, Z., Zhou, M. et al. Ultra-efficient physical field computing by complex-valued network quantization. Nat Commun 17, 3762 (2026). https://doi.org/10.1038/s41467-026-70319-0

Słowa kluczowe: sieci neuronowe o wartościach zespolonych, kwantyzacja modeli, komputerowo generowana holografia, przetwarzanie sygnałów oparte na falach, edge AI