Clear Sky Science · nl

NeoHebbian-synapsen om online training van neuromorfe hardware te versnellen

· Terug naar het overzicht

Chips leren van ervaring

Moderne kunstmatige intelligentie is buitengewoon krachtig, maar nog steeds ver verwijderd van het vermogen van de hersenen om te leren van schaars, vertraagd feedback—zoals onthouden welke sluiproute door de stad echt tijd bespaarde. Dit artikel introduceert een nieuw soort artificiële “synaps”, de verbindingen tussen kunstmatige neuronen, waarmee neuromorfe chips op een meer hersenachtige, online manier kunnen leren terwijl ze compact en energiezuinig blijven. Voor lezers die geïnteresseerd zijn in de toekomst van AI-hardware laat het zien hoe warmte zelf kan worden benut als een nuttig leersignaal binnen kleine geheugenelementen.

Waarom neuromorfe systemen betere synapsen nodig hebben

Neuromorfe computing streeft ernaar na te bootsen hoe de hersenen informatie verwerken: met spikende neurale netwerken, waarbij korte elektrische spikes door uitgestrekte netwerken van synapsen gaan. Hedendaagse hardware kan synapsen al implementeren met memristieve componenten zoals ReRAM, waarvan de elektrische geleidbaarheid kan worden aangepast om een gewicht op te slaan. Eenvoudige “Hebbiaanse” leeregels—waarbij synapsen alleen op basis van lokale spike-timing sterker of zwakker worden—hebben het echter moeilijk op realistische taken die gebeurtenissen koppelen die in de tijd gescheiden zijn, zoals spraakbegrip of navigatieproblemen. Standaard deep-learning technieken lossen dit op met backpropagation through time, maar die methode vraagt te veel geheugen en energie voor hersenachtige hardware. De gemeenschap heeft zich daarom gericht op ‘‘drie-factor’’ leeregels en algoritmen zoals eligibility propagation (e-prop), die bij elke synaps een extra lokale geheugentrace introduceren zodat een vertraagd globaal beloningssignaal toch de juiste verbindingen kan bijstellen.

Figure 1
Figuur 1.

Een vervagend geheugen opslaan in warmte

De kernidee van dit werk is een “neoHebbiaanse” synaps met twee interne toestandsvariabelen: een langetermijn koppeling (gewicht) en een kortetermijn eligibility-trace die recente activiteit onthoudt. Het gewicht wordt, zoals gebruikelijk, gecodeerd in de geleidbaarheid van een ReRAM-apparaat. De eligibility-trace daarentegen wordt bewaard in de lokale temperatuur van dat apparaat, geregeld door een nanoschaal resistieve verwarmingselement dat direct boven of naast het apparaat is geïntegreerd. Tijdens normale spike-verwerking vermenigvuldigt de ReRAM binnenkomende spikes eenvoudig met het opgeslagen gewicht. Tijdens het leren drijven neuronaal gegenereerde signalen die overeenkomen met “wat eerder actief was” en “hoe gevoelig de postsynaptische neuron op dat moment is” stroom door de kleine heater. Omdat de heater en de ReRAM thermisch gekoppeld zijn, verhoogt dit vermogen de temperatuur van het apparaat in verhouding tot het product van die twee signalen—de wiskundige eligibility-trace die het e-prop-algoritme vereist.

Hoe warmte geheugen verandert

Zodra een korte invoersequentie—een zogenaamde dataframe—verwerkt is, codeert de opgelopen temperatuursverhoging hoe “eligible” die synaps is om te veranderen. Er wordt vervolgens een vaste programmeerpuls over de ReRAM aangelegd. Cruciaal is dat gedetailleerde experimenten aantonen dat de resulterende verandering in geleidbaarheid sterk afhangt van temperatuur: warmere apparaten veranderen meer, en de richting en grootte van die verandering hangen af van de initiële geleidbaarheidsstatus en of het apparaat naar een hogere of lagere geleidbaarheid wordt gestuurd. Door zorgvuldig pulsamplitudes te kiezen en deze temperatuursgevoeligheid te benutten, zorgen de auteurs ervoor dat de gewichtsverandering ruwweg evenredig is met de opgeslagen eligibility. Numerieke modellen van warmteverplaatsing in een 3D-geïntegreerde heater-plus-ReRAM-stapel bevestigen dat de temperatuur kan worden verhoogd en over instelbare tijdschalen kan laten vervagen, en dat de structuur zodanig kan worden ontworpen dat gewenste zelfverwarming wordt versterkt terwijl thermische “crosstalk” naar naburige synapsen wordt beperkt.

Figure 2
Figuur 2.

Thermische synapsen op de proef

Om te beoordelen of deze exotische synaps daadwerkelijk nuttig is, simuleren de auteurs volledige neuromorfe systemen die realistisch apparaatsgedrag bevatten zoals temperatuurverval, device-tot-device variabiliteit en beperkte precisie. In een demonstratie bestuurt een spikend netwerk een virtuele muis die moet leren een rasterachtig doolhof te navigeren om kaas te vinden en valstrikken te vermijden. Hier werkt natuurlijke thermische afkoeling—die de opgeslagen eligibility langzaam wegvaagt—als de ‘discount factor’ die bekend is uit reinforcement learning: recente staat‑actieparen wegen zwaarder dan oudere. De simulaties tonen dat leren het snelst gaat wanneer deze vervaging noch te snel noch te traag is, en dat variabiliteit in ReRAM-gedrag de prestaties slechts geleidelijk verslechtert. In een tweede, zwaardere test wordt een recurrent spikend netwerk met thermische neoHebbiaanse synapsen online getraind op de TIMIT-fonemeklasificatuebenc hmark, een standaardtaak voor spraakherkenning. Met voldoende geleidbaarheidsresolutie (ongeveer 8‑bit equivalent) bereikt het hardware-bewuste model een nauwkeurigheid binnen een paar procent van een ideale floating-point implementatie.

Wat dit betekent voor toekomstige AI-hardware

Al met al toont de studie aan dat lokale temperatuur kan dienen als praktisch, bestuurbaar intern geheugen voor geavanceerde leeregels, waardoor snelle on‑chip training mogelijk wordt zonder enorme digitale overhead. De voorgestelde synaps neemt ongeveer hetzelfde oppervlak in beslag als een conventionele ReRAM-cel, maar implementeert zowel een stabiel gewicht als een vervagende trace, en het energieverbruik per leerstap ligt in het picojoule-bereik. Hoewel het gebruik van warmte reële uitdagingen oplevert—temperatuur is moeilijk direct te meten en kan slijtage van het apparaat versnellen—suggereren de bevindingen dat het omarmen, in plaats van het bestrijden van, elektro‑thermische effecten nieuwe klassen compacte leermiddelen zou kunnen ontsluiten. Voor niet-experts is de conclusie dat toekomstige AI-chips niet alleen elektronen zouden kunnen verplaatsen: ze zouden ook kunnen rekenen met zorgvuldig ontworpen patronen van warmte, waardoor machine learning een stap dichter bij de efficiëntie en aanpasbaarheid van het menselijk brein komt.

Bronvermelding: Pande, S., Bezugam, S.S., Bhattacharya, T. et al. NeoHebbian synapses to accelerate online training of neuromorphic hardware. Sci Rep 16, 6836 (2026). https://doi.org/10.1038/s41598-026-35641-z

Trefwoorden: neuromorfe computing, spikende neurale netwerken, ReRAM-synaps, online leren, hardware-efficiënte AI