Clear Sky Science · fr

Architecture informatique en mémoire pour réseaux de Kolmogorov-Arnold basée sur des cellules mémoire modulables de type gaussien

2026-02-20 · Retour à l’index

Pourquoi cette nouvelle idée de puce compte

Les systèmes d’intelligence artificielle d’aujourd’hui, des programmes de jeu aux chatbots, reposent sur d’énormes réseaux d’unités mathématiques simples qui consomment beaucoup d’énergie et nécessitent des puces graphiques puissantes. Cet article présente une autre catégorie de matériel IA qui combine mémoire et calcul au sein des mêmes éléments miniatures et qui est conçue pour une nouvelle classe de réseaux neuronaux appelés réseaux de Kolmogorov–Arnold. Le résultat est un concept de puce visant à apprendre davantage comme un cerveau — de façon flexible et efficiente — tout en utilisant bien moins d’énergie que le matériel grand public actuel.

Une manière neuve pour les réseaux neuronaux d’apprendre

La plupart des réseaux neuronaux utilisés aujourd’hui, comme les perceptrons multicouches, reposent sur des recettes mathématiques fixes où l’apprentissage se fait principalement en ajustant la force des connexions entre neurones artificiels. Les réseaux de Kolmogorov–Arnold adoptent une approche différente : au lieu de seulement régler les poids des connexions, ils apprennent la forme détaillée des fonctions qui transforment les entrées en sorties. Ces courbes apprises servent de blocs de construction personnalisables, permettant au réseau de s’adapter à des motifs de données complexes et, surtout, de se souvenir d’anciennes tâches tout en en apprenant de nouvelles. Cependant, implémenter ces fonctions riches sur des puces ordinaires est coûteux en circuits et en énergie, car cela requiert de nombreux calculs répétés et irréguliers que les processeurs standards et les puces graphiques traitent peu efficacement.

Un nouveau type de cellule mémoire

Pour combler le fossé entre algorithme et matériel, les chercheurs ont conçu un bloc électronique de base qu’ils appellent cellule mémoire de type gaussien. Chaque cellule combine deux composants nanoscale en série : un transistor spécial dont la réponse électrique monte et descend selon une courbe en cloche lisse, et un memristor, un dispositif dont la résistance peut être réglée de façon quasi permanente par des impulsions électriques. En ajustant le memristor, l’équipe peut décaler et mettre à l’échelle la réponse en cloche du transistor, programmant de fait la hauteur et la largeur d’une courbe de type gaussien directement dans le matériel. Les mesures montrent que ces cellules peuvent être reprogrammées à plusieurs reprises, conservent leur état longtemps et présentent un comportement uniforme sur de nombreux cycles et dispositifs, autant de qualités cruciales pour construire de larges matrices fiables.

Transformer les cellules en cerveau en mémoire

L’étape suivante consiste à disposer des milliers de ces cellules mémoire dans des circuits en croisillon (crossbar). Dans cette configuration, des rangées et des colonnes de fils se croisent à chaque cellule, et des signaux appliqués le long des colonnes contrôlent le comportement des cellules tandis que les courants collectés le long des rangées s’additionnent naturellement selon les lois électriques de base. Cela signifie que la puce peut effectuer les opérations centrales d’un réseau de Kolmogorov–Arnold — additionner de nombreuses fonctions de type gaussien pour former une courbe d’activation flexible — directement là où l’information est stockée, sans transférer les données entre processeurs et mémoire. Des circuits supplémentaires permettent de représenter et sommer des contributions positives et négatives, et des chemins résiduels optionnels améliorent la stabilité des réseaux profonds sans remplacer le calcul principal en mémoire.

Mettre l’architecture à l’épreuve

En s’appuyant sur des simulations détaillées liées au comportement mesuré des dispositifs, les auteurs montrent que des réseaux construits à partir de ces matrices de cellules mémoire peuvent s’attaquer à un large éventail de tâches. Ils ajustent avec succès des fonctions unidimensionnelles complexes sans oublier les précédentes, reconnaissent des chiffres manuscrits et des vêtements, résolvent des équations aux dérivées partielles et prédisent des séries temporelles chaotiques. Dans ces différents scénarios, les réseaux à cellules gaussiennes conservent les forces clés des réseaux de Kolmogorov–Arnold : de bonnes performances avec relativement peu de paramètres et une capacité marquée à éviter l’oubli catastrophique lors de l’apprentissage de nouvelles tâches. Par rapport aux réseaux neuronaux conventionnels implémentés avec du matériel memristif similaire, la nouvelle architecture atteint souvent une meilleure précision et généralisation tout en utilisant des couches intermédiaires plus petites.

Économies d’énergie et promesse pratique

Puisque le calcul a lieu au sein des mêmes éléments qui stockent les paramètres appris, l’architecture proposée évite en grande partie le trafic coûteux entre mémoire et processeur qui pénalise le matériel IA actuel. Les auteurs estiment que leur système de cellules mémoire de type gaussien peut effectuer les opérations centrales des réseaux de Kolmogorov–Arnold avec une efficacité énergétique supérieure d’environ deux ordres de grandeur par rapport aux puces graphiques modernes exécutant des algorithmes équivalents. En termes simples, le travail décrit comment construire des puces où chaque minuscule dispositif peut à la fois mémoriser et calculer des réponses en cloche flexibles, et où de nombreux dispositifs collaborent en parallèle. Cela ouvre la voie à du matériel neuromorphique futur qui apprend en continu, résiste à l’oubli et exécute des modèles d’IA puissants avec beaucoup moins d’énergie que les plates-formes existantes.

Citation: Wen, Z., Zhang, Q., Chen, J. et al. Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells. Nat Commun 17, 3496 (2026). https://doi.org/10.1038/s41467-026-69592-w

Mots-clés: informatique neuromorphique, calcul en mémoire, réseaux de Kolmogorov-Arnold, dispositifs memristifs, matériel IA économe en énergie