Clear Sky Science · pl

Architektura obliczeń w pamięci dla sieci Kolmogorov-Arnolda oparta na regulowanych komórkach pamięci o kształcie zbliżonym do Gaussa

2026-02-20 · Powrót do spisu

Dlaczego ten nowy pomysł na układ scalony ma znaczenie

Współczesne systemy sztucznej inteligencji, od programów grających w gry po chatboty, opierają się na ogromnych sieciach prostych jednostek matematycznych, które pochłaniają dużo energii i wymagają wydajnych układów graficznych. W artykule opisano inny rodzaj sprzętu AI, który łączy pamięć i obliczenia w tych samych niewielkich elementach i jest dostosowany do nowej klasy sieci neuronowych zwanych sieciami Kolmogorov–Arnolda. Efektem jest koncepcja chipu, która ma uczyć się bardziej przypominająco mózg — elastycznie i efektywnie — przy znacznie mniejszym zużyciu energii niż obecne popularne rozwiązania.

Nowy sposób uczenia się sieci neuronowych

Większość dzisiaj używanych sieci neuronowych, takich jak perceptrony wielowarstwowe, opiera się na stałych przepisach matematycznych, gdzie uczenie polega głównie na dostosowywaniu siły połączeń między sztucznymi neuronami. Sieci Kolmogorov–Arnolda stosują inne podejście: zamiast jedynie stroić siły połączeń, uczą szczegółowego kształtu funkcji przekształcających wejścia na wyjścia. Nauczycielskie krzywe działają jak konfigurowalne bloki konstrukcyjne, pozwalając sieci dopasować się do złożonych wzorców danych i, co ważne, zapamiętywać poprzednie zadania podczas nauki nowych. Jednak implementacja tych złożonych funkcji na zwykłych układach jest kosztowna pod względem obwodów i zużycia energii, ponieważ wymaga wielu powtarzalnych i nieregularnych obliczeń, które standardowe procesory i układy graficzne wykonują nieefektywnie.

Nowy rodzaj komórki pamięci

Aby wypełnić lukę między algorytmem a sprzętem, badacze zaprojektowali podstawowy blok elektroniczny nazwany komórką pamięci o kształcie zbliżonym do Gaussa. Każda komórka łączy w szeregu dwa nanoskalowe elementy: specjalny tranzystor, którego odpowiedź elektryczna rośnie i opada w gładkiej krzywej dzwonowej, oraz memrystor — urządzenie, którego rezystancję można trwale regulować impulsami elektrycznymi. Poprzez dostrojenie memrystora zespół może przesuwać i skalować odpowiedź tranzystora, skutecznie programując wysokość i szerokość krzywej podobnej do Gaussa bezpośrednio w sprzęcie. Pomiary pokazują, że te komórki można wielokrotnie przeprogramowywać, utrzymują stan przez długi czas i zachowują jednolite działanie przez wiele cykli i urządzeń — wszystko to jest kluczowe do budowy niezawodnych, dużych macierzy.

Przekształcanie komórek w mózg w pamięci

Następnym krokiem jest ułożenie tysięcy tych komórek pamięci w krzyżowe układy typu crossbar. W takim układzie rzędy i kolumny przewodów przecinają się na każdej komórce, a sygnały przykładane wzdłuż kolumn sterują zachowaniem komórek, podczas gdy prądy zbierane wzdłuż rzędów dodają się zgodnie z podstawowymi prawami elektrycznymi. Oznacza to, że chip może wykonywać podstawowe operacje sieci Kolmogorov–Arnolda — sumować wiele funkcji o kształcie zbliżonym do Gaussa, tworząc elastyczną krzywą aktywacji — bezpośrednio tam, gdzie informacje są przechowywane, bez przemieszczania danych między oddzielnymi procesorami i pamięcią. Dodatkowe układy pozwalają reprezentować i sumować wkłady dodatnie i ujemne, a opcjonalne ścieżki rezydualne zwiększają stabilność głębokich sieci bez zastępowania podstawowych obliczeń w pamięci.

Testy architektury

Wykorzystując szczegółowe symulacje powiązane z mierzonymi właściwościami urządzeń, autorzy pokazują, że sieci zbudowane z tych macierzy komórek pamięci potrafią sprostać szerokiemu zakresowi zadań. Pomyślnie dopasowali skomplikowane funkcje jednowymiarowe bez zapominania wcześniejszych, rozpoznawali odręcznie pisane cyfry i elementy odzieży, rozwiązywali równania różniczkowe cząstkowe oraz prognozowali chaotyczne szeregi czasowe. W tych zastosowaniach sieci oparte na komórkach Gaussowskich zachowują kluczowe zalety sieci Kolmogorov–Arnolda: dobrą wydajność przy stosunkowo niewielkiej liczbie parametrów oraz wyraźną zdolność unikania katastrofalnego zapominania podczas trenowania nowych zadań. W porównaniu z konwencjonalnymi sieciami neuronowymi zaimplementowanymi na podobnym sprzęcie memrystorowym, nowa architektura często osiąga lepszą dokładność i uogólnianie przy mniejszych warstwach pośrednich.

Oszczędność energii i praktyczne perspektywy

Ponieważ obliczenia zachodzą wewnątrz tych samych elementów, które przechowują wyuczone parametry, proponowana architektura w dużej mierze omija kosztowny ruch danych między pamięcią a procesorem, który obciąża dzisiejszy sprzęt AI. Autorzy szacują, że ich system komórek pamięci o kształcie zbliżonym do Gaussa może wykonywać podstawowe operacje sieci Kolmogorov–Arnolda z około dwiema rzędami wielkości lepszą efektywnością energetyczną niż nowoczesne układy graficzne uruchamiające równoważne algorytmy. Mówiąc prościej, praca opisuje, jak zbudować układy, w których każde maleńkie urządzenie może jednocześnie pamiętać i obliczać elastyczne odpowiedzi dzwonowe, a wiele takich urządzeń współpracuje równolegle. To wskazuje drogę ku przyszłemu sprzętowi neuromorficznemu, który uczy się ciągle, opiera się zapominaniu i uruchamia potężne modele AI przy znacznie mniejszym zużyciu energii niż istniejące platformy.

Cytowanie: Wen, Z., Zhang, Q., Chen, J. et al. Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells. Nat Commun 17, 3496 (2026). https://doi.org/10.1038/s41467-026-69592-w

Słowa kluczowe: komputery neuromorficzne, obliczenia w pamięci, sieci Kolmogorov-Arnolda, urządzenia memrystorowe, energooszczędny sprzęt AI