Clear Sky Science · it
Architettura di computing-in-memory per reti di Kolmogorov-Arnold basata su celle di memoria di tipo gaussiano regolabili
Perché questa nuova idea di chip conta
I sistemi di intelligenza artificiale odierni, dai programmi che giocano ai chatbot, si basano su enormi reti di semplici unità matematiche che consumano molta energia e richiedono potenti chip grafici. Questo articolo presenta un tipo diverso di hardware per l’IA che fonde memoria e calcolo negli stessi elementi minuscoli ed è pensato per una nuova classe di reti neurali chiamate reti di Kolmogorov–Arnold. Il risultato è un concetto di chip che mira ad apprendere in modo più simile al cervello—con flessibilità ed efficienza—utilizzando molto meno consumo rispetto all’hardware dominante attuale.

Un modo nuovo per le reti neurali di apprendere
La maggior parte delle reti neurali in uso oggi, come i perceptron multistrato, si basa su ricette matematiche fisse in cui l’apprendimento avviene principalmente regolando la forza delle connessioni tra neuroni artificiali. Le reti di Kolmogorov–Arnold adottano un approccio diverso: invece di limitarsi a sintonizzare i pesi delle connessioni, apprendono la forma dettagliata delle funzioni che trasformano gli ingressi in uscite. Queste curve apprese funzionano come blocchi costruibili personalizzabili, permettendo alla rete di adattarsi a schemi di dati complessi e, cosa importante, di ricordare compiti precedenti mentre ne apprende di nuovi. Tuttavia, implementare queste funzioni ricche su chip ordinari è costoso in termini di circuito ed energia, perché richiede numerosi calcoli ripetuti e irregolari che i processori standard e i chip grafici non gestiscono in modo efficiente.
Un nuovo tipo di cella di memoria
Per colmare questo divario tra algoritmo e hardware, i ricercatori hanno progettato un blocco elettronico di base che chiamano cella di memoria di tipo gaussiano. Ogni cella combina due componenti su scala nanometrica in serie: un transistor speciale la cui risposta elettrica sale e scende secondo una curva a campana liscia, e un memristor, un dispositivo la cui resistenza può essere regolata in modo permanente tramite impulsi elettrici. Regolando il memristor, il team può spostare e scalare la risposta a campana del transistor, programmando di fatto altezza e larghezza di una curva di tipo gaussiano direttamente nell’hardware. Le misure mostrano che queste celle possono essere riprogrammate ripetutamente, mantengono il loro stato per lunghi periodi e si comportano in modo uniforme su molti cicli e dispositivi, tutte caratteristiche fondamentali per costruire array ampi e affidabili.
Trasformare le celle in un cervello in memoria
Il passo successivo è disporre migliaia di queste celle di memoria in circuiti a matrice incrociata. In questa configurazione, righe e colonne di fili si intersecano in ogni cella, e i segnali applicati lungo le colonne controllano il comportamento delle celle mentre le correnti raccolte lungo le righe si sommano naturalmente secondo le leggi elettriche di base. Ciò significa che il chip può eseguire le operazioni fondamentali di una rete di Kolmogorov–Arnold—sommandone molte funzioni di tipo gaussiano per formare una curva di attivazione flessibile—direttamente dove l’informazione è memorizzata, senza spostare i dati avanti e indietro tra processori e memoria separati. Circuiti aggiuntivi permettono di rappresentare e sommare contributi positivi e negativi, e percorsi residuali opzionali migliorano la stabilità delle reti profonde senza sostituire il nucleo del calcolo in memoria.
Mettere alla prova l’architettura
Usando simulazioni dettagliate basate sul comportamento misurato dei dispositivi, gli autori mostrano che reti costruite con questi array di celle di memoria possono affrontare una vasta gamma di compiti. Adattano con successo funzioni unidimensionali complesse senza dimenticare quelle precedenti, riconoscono cifre scritte a mano e capi d’abbigliamento, risolvono equazioni alle derivate parziali e prevedono serie temporali caotiche. In tutti questi contesti, le reti a celle gaussiane conservano i punti di forza chiave delle reti di Kolmogorov–Arnold: prestazioni elevate con relativamente pochi parametri e una marcata capacità di evitare il cosiddetto catastrophic forgetting quando vengono addestrate su nuovi compiti. Rispetto alle reti neurali convenzionali implementate su hardware memristivo simile, la nuova architettura spesso raggiunge migliore accuratezza e generalizzazione usando strati intermedi più piccoli.

Risparmio energetico e prospettive pratiche
Poiché il calcolo avviene all’interno degli stessi elementi che memorizzano i parametri appresi, l’architettura proposta evita in gran parte il traffico oneroso tra memoria e processore che affligge l’hardware AI attuale. Gli autori stimano che il loro sistema di celle di memoria di tipo gaussiano possa eseguire le operazioni centrali delle reti di Kolmogorov–Arnold con un’efficienza energetica migliore di circa due ordini di grandezza rispetto ai moderni chip grafici che eseguono algoritmi equivalenti. In termini semplici, il lavoro delinea come costruire chip in cui ogni minuscolo dispositivo può sia ricordare sia calcolare risposte a campana flessibili, e in cui molti di questi dispositivi collaborano in parallelo. Ciò indica la strada verso un futuro hardware neuromorfico che apprende continuamente, resiste all’oblio e mantiene potenti modelli di IA consumando molto meno energia rispetto alle piattaforme esistenti.
Citazione: Wen, Z., Zhang, Q., Chen, J. et al. Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells. Nat Commun 17, 3496 (2026). https://doi.org/10.1038/s41467-026-69592-w
Parole chiave: calcolo neuromorfico, computazione in memoria, reti di Kolmogorov-Arnold, dispositivi memristor, hardware AI a basso consumo