Clear Sky Science · pl
NeoHebbiańskie synapsy przyspieszające trening online sprzętu neuromorficznego
Uczenie układów scalonych na podstawie doświadczenia
Współczesna sztuczna inteligencja jest niezwykle potężna, ale wciąż daleko jej do mózgu, jeśli chodzi o uczenie się z rzadkich, opóźnionych informacji zwrotnych — na przykład zapamiętania, która dróżka przez miasto rzeczywiście zaoszczędziła czas. W artykule przedstawiono nowy rodzaj sztucznej „synapsy”, czyli połączenia między sztucznymi neuronami, który pozwala układom neuromorficznym uczyć się w bardziej mózgo‑podobny, online’owy sposób, zachowując jednocześnie kompaktowość i efektywność energetyczną. Dla czytelników zainteresowanych przyszłością sprzętu AI pokazuje, jak samo ciepło można wykorzystać jako użyteczny sygnał uczący wewnątrz mikroskopijnych elementów pamięci.
Dlaczego mózgo‑podobne układy potrzebują lepszych synaps
Obliczenia neuromorficzne dążą do naśladowania sposobu, w jaki mózg przetwarza informacje: za pomocą spikingowych sieci neuronowych, w których krótkie impulsy elektryczne przechodzą przez rozległe sieci synaps. Dzisiejszy sprzęt potrafi już implementować synapsy przy użyciu komponentów memrystorowych, takich jak ReRAM, których przewodność elektryczna może być dostrojona, by przechowywać wagę. Jednak proste reguły uczenia „hebbowskiego” — gdzie synapsy wzmacniają się lub osłabiają wyłącznie w oparciu o lokalne zależności czasowe impulsów — mają trudności z realistycznymi zadaniami wymagającymi łączenia zdarzeń rozdzielonych w czasie, takimi jak rozumienie mowy czy rozwiązywanie problemów nawigacyjnych. Standardowe techniki uczenia głębokiego rozwiązują to przez wsteczną propagację w czasie, ale ta metoda wymaga zbyt dużo pamięci i energii, by była praktyczna dla sprzętu inspirowanego mózgiem. Dlatego środowisko badawcze zwróciło się ku regułom uczenia „trójczynnikowego” i algorytmom takim jak eligibility propagation (e‑prop), które wprowadzają dodatkowy lokalny ślad pamięci w każdej synapsie, tak aby opóźniony globalny sygnał nagrody mógł mimo to korygować właściwe połączenia.

Przechowywanie zanikającej pamięci w cieple
Główny pomysł tej pracy to „neoHebbiańska” synapsa, która ma dwie wewnętrzne zmienne stanu: wagę długoterminową i krótkotrwały ślad zgodności (eligibility), pamiętający niedawną aktywność. Waga jest zakodowana, jak zwykle, w przewodności urządzenia ReRAM. Ślad zgodności natomiast przechowywany jest w lokalnej temperaturze tego urządzenia, kontrolowanej przez nanoskalowy rezystancyjny grzejnik zintegrowany bezpośrednio nad nim lub obok niego. Podczas normalnego przetwarzania impulsów ReRAM po prostu mnoży nadchodzące impulsy przez przechowywaną wagę. W trakcie uczenia sygnały generowane przez neurony odpowiadające „co odpaliło wcześniej” oraz „jak bardzo neuronu postsynaptycznemu zależy teraz” przepuszczają prąd przez maleńki grzejnik. Ponieważ grzejnik i ReRAM są sprzężone termicznie, ta moc podnosi temperaturę urządzenia proporcjonalnie do iloczynu tych dwóch sygnałów — matematycznego śladu zgodności wymaganego przez algorytm e‑prop.
Jak ciepło zmienia pamięć
Po przetworzeniu krótkiej sekwencji wejściowej — zwanej dataframe — zgromadzony wzrost temperatury koduje, jak bardzo dana synapsa jest „kwalifikowalna” do zmiany. Następnie stosowany jest stały impuls programujący przez ReRAM. Kluczowe eksperymenty pokazują, że wynikowa zmiana przewodności silnie zależy od temperatury: gorętsze urządzenia zmieniają się bardziej, a kierunek i wielkość tej zmiany zależą od początkowego stanu przewodności oraz od tego, czy urządzenie jest napędzane w kierunku wyższej czy niższej przewodności. Poprzez staranny dobór amplitud impulsów i wykorzystanie tej wrażliwości na temperaturę, autorzy tak dobierają warunki, by zmiana wagi była w przybliżeniu proporcjonalna do przechowywanej zgodności. Modele numeryczne przepływu ciepła w trójwymiarowej strukturze grzejnik‑plus‑ReRAM potwierdzają, że temperaturę można podnieść i pozwolić jej zanikać w tunelowalnych skalach czasowych, a także, że strukturę można zaprojektować tak, by wzmacniać pożądane samonagrzewanie przy jednoczesnym ograniczaniu termicznego „przesłuchu” do sąsiednich synaps.

Testy synaps termicznych
Aby ocenić, czy ten egzotyczny typ synaps jest praktycznie użyteczny, autorzy symulują pełne systemy neuromorficzne uwzględniające realistyczne zachowania urządzeń, takie jak zanik temperatury, zmienność między urządzeniami i ograniczona precyzja. W jednej demonstracji sieć spikingowa steruje wirtualnym szczurem, który musi nauczyć się poruszać po labiryncie w postaci siatki, by znaleźć ser i unikać pułapek. Tutaj naturalne chłodzenie termiczne — które powoli eroduje zgromadzony ślad zgodności — działa jak współczynnik dyskonta znany z uczenia ze wzmocnieniem: pary stan‑akcja z ostatnich chwil mają większe znaczenie niż te dawne. Symulacje pokazują, że uczenie jest najszybsze, gdy to zanikanie nie jest ani zbyt szybkie, ani zbyt wolne, a zmienność zachowania ReRAM pogarsza wydajność tylko stopniowo. W drugim, trudniejszym teście rekurencyjna spikingowa sieć z termicznymi neoHebbiańskimi synapsami jest szkolona online na benchmarku klasyfikacji fonemów TIMIT, standardowym zadaniu rozpoznawania mowy. Przy wystarczającej rozdzielczości przewodności (około równoważnika 8 bitów) model uwzględniający cechy sprzętowe osiąga dokładność w granicach kilku procent od idealnej implementacji zmiennoprzecinkowej.
Co to oznacza dla przyszłego sprzętu AI
Ogólnie rzecz biorąc, badanie pokazuje, że lokalna temperatura może służyć jako praktyczna, sterowalna wewnętrzna pamięć dla zaawansowanych reguł uczenia, umożliwiając szybkie szkolenie na chipie bez masywnego cyfrowego narzutu. Proponowana synapsa zajmuje mniej więcej taką samą powierzchnię jak konwencjonalna komórka ReRAM, a mimo to implementuje zarówno stabilną wagę, jak i zanikający ślad, a jej koszt energetyczny na krok uczenia mieści się w zakresie pikodżuli. Choć poleganie na cieple rodzi realne wyzwania — temperatura jest trudna do bezpośredniego pomiaru i może przyspieszać zużycie urządzeń — praca sugeruje, że akceptacja, zamiast zwalczania, efektów elektrotermicznych może odblokować nowe klasy kompaktowego sprzętu uczącego się. Dla laików kluczowa myśl jest taka, że przyszłe układy AI mogą nie tylko przesyłać elektrony: mogą również obliczać, wykorzystując starannie zaprojektowane wzorce ciepła, przybliżając uczenie maszynowe do efektywności i adaptacyjności ludzkiego mózgu.
Cytowanie: Pande, S., Bezugam, S.S., Bhattacharya, T. et al. NeoHebbian synapses to accelerate online training of neuromorphic hardware. Sci Rep 16, 6836 (2026). https://doi.org/10.1038/s41598-026-35641-z
Słowa kluczowe: obliczenia neuromorficzne, spikingowe sieci neuronowe, synapsa ReRAM, uczenie online, efektywna energetycznie sztuczna inteligencja