Clear Sky Science · nl

LIMO: Low-power in-memory-annealer en matrixvermenigvuldiging-primitive voor edge computing

2026-02-28 · Terug naar het overzicht

Slimmere routes en zuinigere chips

Dagelijks staan bedrijven voor raadsels zoals het vinden van de kortste route voor een bezorgwagen die duizenden stops aandoet, of het snel scannen van beelden om gezichten te herkennen met een batterijgevoede camera. Deze problemen belasten moderne computers, die grote hoeveelheden data heen en weer tussen geheugen en processor verplaatsen. Dit artikel introduceert LIMO, een nieuw soort laagvermogen rekenblok dat data op zijn plaats houdt terwijl het zulke lastige routeplanningsproblemen oplost en kunstmatige intelligentie (AI)-modellen uitvoert, waardoor toekomstig edge-hardware sneller en energiezuiniger wordt.

Waarom goede routes zo lastig te vinden zijn

Centraal in dit werk staat het beroemde Traveling Salesman Problem: gegeven veel steden, vind de kortste tocht die elke stad precies één keer aandoet en terugkeert naar het begin. Voor kleine kaarten vinden exacte wiskundige methoden de beste oplossing. Maar zodra het aantal steden in de tienduizenden loopt, explodeert het aantal mogelijke tochten en lopen zelfs krachtige computers vast. Heuristieken zoals simulated annealing kunnen deze enorme zoekruimte doorzoeken op zoek naar goede, hoewel niet perfecte, tochten door af en toe een slechtere tussenoplossing te accepteren om niet vast te lopen. Conventionele benaderingen verkennen echter nog steeds inefficiënt de zoekruimte voor zeer grote problemen en verspillen tijd aan het verplaatsen van data tussen geheugen en CPU, het zogenaamde “memory wall”.

Een nieuwe manier om mogelijkheden te doorzoeken

De auteurs stellen een nieuw algoritme voor, Significance Weighted Annealed Insertion (SWAI), dat de wijze waarop kandidaat-tochten worden onderzocht verandert. In plaats van voortdurend paren steden te verwisselen — een aanpak die slecht schaalt met het aantal steden — bouwt SWAI tochten stap voor stap door telkens één nieuwe stad in te voegen. Bij elke stap kiest het soms de dichtstbijzijnde volgende stad (een gretige keuze) en soms op gecontroleerde willekeur die kortere kandidaat-verbindingen bevoordeelt maar langere niet volledig uitsluit. Deze bias wordt in de loop van de tijd bijgesteld: aanvankelijk avontuurlijker en naarmate de zoektocht vordert steeds conservatiever. Omdat elke stap opties bekijkt op een manier die slechts lineair groeit met het aantal steden, verkent het algoritme lange-afstandsverbeteringen effectiever dan traditionele simulated annealing.

Berekeningen in geheugen met ingebouwde willekeur

LIMO zet dit algoritme om in hardware door de schakeling en de zoekmethode nauwkeurig mee te ontwerpen. De kern is een gemodificeerde geheugenarray die zowel de huidige tocht als de afstanden tussen steden opslaat en de belangrijkste update-stappen uitvoert zonder voortdurend met een aparte processor te moeten communiceren. De willekeurige keuzes die het algoritme nodig heeft, komen van piepkleine magnetische devices genaamd spin-transfer-torque magnetic tunnel junctions, die van nature hun toestand onvoorspelbaar omkeren wanneer ze met de juiste stroom worden aangestuurd. De ontwerpers zetten deze fysische willekeur om in digitale bits en gebruiken eenvoudige vergelijkingen om de probabilistische beslissingen in het algoritme te implementeren. Omdat de meeste operaties digitaal blijven en direct in het geheugen plaatsvinden, vermijdt het systeem omvangrijke converters en kwetsbare analoge schakelingen, wat zowel energie als oppervlakte bespaart.

Grote problemen in stukjes breken

Om echt grote routeplanningsopgaven tot 85.900 steden aan te kunnen, gebruikt het systeem een divide-and-conquer-strategie. Een lichte geometrische methode groepeert nabijgelegen steden in clusters totdat elke cluster klein genoeg is om in één LIMO-blok te passen. De hardware lost veel van deze subroutes parallel op en naait ze vervolgens terug aan elkaar tot een volledige tocht. Extra verfijningsstappen polijsten de globale route verder: segmenten van de tocht worden door de hardware opnieuw geoptimaliseerd en een klassieke “2-opt” nabehandeling op een reguliere processor verwijdert overblijvende kruisingen. In tests op standaard benchmarks leverde deze gecombineerde aanpak tochten van hogere kwaliteit dan eerdere gespecialiseerde annealing-machines, terwijl op de grootste problemen antwoorden tot ongeveer vijf keer sneller werden bereikt.

Van lastige routes naar efficiënte AI

LIMO beperkt zich niet tot routeplanning. Dezelfde geheugenarray kan ook dienen als bouwsteen voor neurale netwerken door vector–matrixvermenigvuldigingen uit te voeren, de kernoperatie achter beeld- en patroonherkenning. In plaats van energieverslindende, nauwkeurige converters te gebruiken om analoge signalen uit te lezen, vertrouwt LIMO op zeer eenvoudige detectiecircuitjes die alleen het teken van het geaccumuleerde signaal vastleggen, en compenseert voor deze grofheid door netwerken hardware-bewust te trainen. Bij taken als beeldclassificatie en gezichtdetectie bereikten deze netwerken nauwkeurigheid dicht bij standaard softwaremodellen, terwijl ze het energieverbruik en de reactietijd verlaagden vergeleken met conventionele compute-in-memory-chips. Voor alledaagse gebruikers betekent dit dat camera’s, drones en andere edge-apparaten op den duur complexe planningsopgaven kunnen oplossen en AI-modellen langer op een batterij kunnen draaien, dankzij slimmer zoeken en rekenen direct waar de data zich bevindt.

Bronvermelding: Holla, A., Chatterjee, S., Sen, S. et al. LIMO: Low-power in-memory-annealer and matrix-multiplication primitive for edge computing. npj Unconv. Comput. 3, 10 (2026). https://doi.org/10.1038/s44335-026-00054-8

Trefwoorden: in-memory computing, traveling salesman problem, hardware annealing, low-power AI, edge computing