Clear Sky Science · pl

Skalowalne i odporne wielobitowe synapsy spintroniczne do analogowego przetwarzania w pamięci

2026-02-16 · Powrót do spisu

Dlaczego mądrzejsza pamięć ma znaczenie dla codziennej sztucznej inteligencji

Od asystentów głosowych po aplikacje do zdjęć, współczesna sztuczna inteligencja opiera się w dużej mierze na głębokich sieciach neuronowych — programach operujących milionami drobnych wartości liczbowych, zwanych wagami, które decydują o wynikach. Przenoszenie tych wag między pamięcią a procesorami zużywa znacznie więcej energii niż same obliczenia. Artykuł opisuje nowy rodzaj magnetycznej komórki pamięci, która może nie tylko przechowywać te wagi, lecz także pomagać w wykonywaniu obliczeń bezpośrednio tam, gdzie dane są zapisane, obiecując szybszy i bardziej energooszczędny sprzęt AI.

Wprowadzanie obliczeń podobnych do mózgu do układu pamięci

Dzisiejsze komputery podążają klasycznym schematem von Neumanna, w którym dane nieustannie krążą między pamięcią a oddzielnym procesorem. Sieci neuronowe, sprowadzające się do ogromnej liczby mnożeń macierz-wektor, szczególnie odczuwają to ograniczenie. Obiecującą alternatywą jest przetwarzanie w pamięci, gdzie duża siatka (tablica krzyżowa) komórek pamięci przechowuje wagi sieci i jednocześnie zamienia przyłożone napięcia na prądy wyjściowe reprezentujące obliczenia. W roli tej testowano wiele eksperymentalnych rodzajów pamięci, ale często cechują się one hałaśliwym zachowaniem i dryfem wartości, co jest ryzykowne, gdy każda komórka musi reprezentować więcej niż 0 lub 1.

Figure 1.

Przekształcanie pamięci magnetycznej z trybu włącz/wyłącz na „analogowy”

Autorzy bazują na magnetycznej pamięci o dostępie swobodnym (MRAM), nieulotnej technologii cenionej za szybkość, trwałość i kompatybilność z standardowymi procesami chipowymi. Konwencjonalna komórka MRAM to magnetyczne złącze tunelowe: dwie warstwy magnetyczne oddzielone izolatorem. W zależności od tego, czy warstwy są wyrównane, czy przeciwne, rezystancja komórki jest niska lub wysoka, kodując pojedynczy bit. Kluczowym pomysłem jest przeprojektowanie „wolnej” warstwy magnetycznej tak, by nie była jednorodnym blokiem zmieniającym stan jednocześnie. Zamiast tego nowe rozwiązanie łączy bardzo cienką ciągłą warstwę z grubszą, ziarnistą warstwą magnetyczną złożoną z wielu drobnych ziaren magnetycznych. Każde ziarno może przechylać orientację przy nieco innych prądach, dzięki czemu ogólna rezystancja może ustalać się w kilku pośrednich, stabilnych poziomach zamiast wyłącznie „niskiego” i „wysokiego”.

Ile odcieni magnetyzmu jest użytecznych?

Wykorzystując szczegółowe modele komputerowe dynamiki magnetycznej, zespół pokazuje, że wprowadzenie prądu spolaryzowanego spinowo do tej warstwy kompozytowej powoduje stopniowy proces przełączania ziarenko po ziarnku. W miarę zmiany prądu średnia magnetyzacja, a tym samym rezystancja, tworzy gładką krzywą w kształcie litery S, umożliwiając niemal ciągłe stany analogowe. Autorzy badają następnie, jak różnice produkcyjne między komórkami i losowe efekty termalne między cyklami zapisu zakłócają te poziomy. Stwierdzają, że podczas gdy stany pośrednie są nieco bardziej zaszumione, stany skrajne (całkowicie przełączone w jedną lub drugą stronę) pozostają bardzo stabilne i zwarte. Dla realistycznych rozmiarów urządzeń (około 50–75 nanometrów na bok) dochodzą do wniosku, że praktyczne są cztery rozróżnialne poziomy rezystancji — równoważne 2 bitom na komórkę — bez nadmiernej liczby błędów.

Figure 2.

Od pojedynczej komórki do pełnego akceleratora AI

Aby być użytecznym, wielopoziomowy MRAM musi być odczytywany dokładnie i zintegrowany z pełnymi systemami obliczeniowymi. Autorzy projektują i symulują układ pomiarowy wykorzystujący szybki „flash” przetwornik analogowo-cyfrowy do rozróżniania czterech poziomów rezystancji każdej komórki. Analizują, jak kontrast między najwyższymi a najniższymi stanami przewodności wpływa na szybkość odczytu, zużycie energii i rozmiar układu pomiarowego, wykazując, że lepszy kontrast przekłada się bezpośrednio na szybsze i bardziej energooszczędne odczyty. Następnie osadzają model MRAM z 2 bitami na komórkę w symulowanym akceleratorze in-memory, uruchamiając sieć ResNet-18 na zbiorze obrazów CIFAR-10. W porównaniu do bazowego rozwiązania z klasycznymi 1-bitowymi komórkami MRAM, wersja wielobitowa zwiększa gęstość pamięci mniej więcej dwukrotnie i zmniejsza wymaganą liczbę płytek krzyżowych o połowę. Przekłada się to na redukcje powierzchni układu, zużycia energii i opóźnień do około 1,8× oraz ponad 3× poprawę skumulowanego wskaźnika energia–opóźnienie, przy zachowaniu praktycznie tej samej dokładności rozpoznawania sieci.

Jak to się ma do innych pomysłów na pamięć

Badanie porównuje też to podejście z konkurencyjnymi technologiami, takimi jak pamięć rezystancyjna (ReRAM) czy pamięć fazowa (PCM), a także z innymi koncepcjami magnetycznymi opartymi na ruchu ścian domenowych czy skyrmionach. Choć te alternatywy również mogą dawać zachowania przypominające analogowe, często wymagają większych urządzeń lub specjalnych kształtów i bywają bardziej nieprzewidywalne. W przeciwieństwie do nich ziarniste komórki MRAM zachowują przyjazność produkcyjną i trwałość mainstreamowego MRAM, zyskując jednocześnie dodatkowe poziomy pamięci. Testy na poziomie systemu sugerują, że przy realistycznych wariacjach synapsy oparte na MRAM utrzymują dokładność sieci neuronowych znacznie lepiej niż podobne rozwiązania wykorzystujące bardziej zmienne pamięci rezystancyjne, szczególnie gdy sieci są przerzedzane, by oszczędzić energię.

Co to oznacza dla przyszłej codziennej sztucznej inteligencji

Mówiąc prościej, autorzy pokazali sposób, by nauczyć sprawdzoną technologię magnetycznej pamięci przechowywania nie tylko zer i jedynek, lecz także małych wartości wag analogowych bezpośrednio wewnątrz kompaktowej komórki. Poprzez staranne zaprojektowanie warstwowej struktury, która rozdziela zachowanie magnetyczne na wiele drobnych ziaren, uzyskują wiele stabilnych poziomów rezystancji wystarczająco odpornych do zastosowań AI w świecie rzeczywistym. Gdy takie komórki są rozmieszczone w dużych macierzach i sparowane z odpowiednimi układami pomiarowymi, mogą wykonywać podstawowe obliczenia uczenia głębokiego przy jednoczesnym drastycznym ograniczeniu ruchu danych. W razie wdrożenia w sprzęcie wielobitowe synapsy spintroniczne mogłyby uczynić przyszłe systemy AI — zarówno w centrach danych, smartfonach, jak i wbudowanych czujnikach — szybszymi i bardziej energooszczędnymi bez poświęcania dokładności.

Cytowanie: Gupte, K.K., Mugdho, S.S., Huang, C. et al. Scalable and robust multi-bit spintronic synapses for analog in-memory computing. npj Unconv. Comput. 3, 8 (2026). https://doi.org/10.1038/s44335-026-00055-7

Słowa kluczowe: przetwarzanie w pamięci, pamięć spintroniczna, MRAM, sprzęt neuromorficzny, głębokie sieci neuronowe