Clear Sky Science · ru

Архитектура вычислений в памяти для сетей Колмогорова–Арнольда на основе настраиваемых ячеек памяти с гауссовоподобной характеристикой

· Назад к списку

Почему эта идея нового чипа важна

Современные системы искусственного интеллекта, от игровых программ до чат-ботов, опираются на огромные сети простых арифметических блоков, которые потребляют много энергии и требуют мощных графических процессоров. В статье предлагается другой тип аппаратуры ИИ, который объединяет память и вычисления в одних и тех же крошечных элементах и адаптирован для нового класса нейронных сетей — сетей Колмогорова–Арнольда. В результате получается концепция чипа, которая стремится учиться ближе к биологическому мозгу — гибко и эффективно — при значительно меньшем энергопотреблении по сравнению с современным основным оборудованием.

Figure 1
Figure 1.

Новый подход к обучению нейросетей

Большинство нейросетей, используемых сегодня, например многослойные перцептроны, опираются на фиксированные математические схемы, где обучение сводится в основном к настройке весов связей между искусственными нейронами. Сети Колмогорова–Арнольда идут другим путем: вместо того чтобы лишь менять силы связей, они обучают детальную форму функций, преобразующих входы в выходы. Эти выученные кривые выступают в роли настраиваемых строительных блоков, позволяя сети адаптироваться к сложным шаблонам данных и, что важно, сохранять старые задачи при обучении новым. Однако реализация таких богатых по форме функций на обычных чипах дорого обходится с точки зрения схемотехники и энергии, поскольку требует многих повторяющихся и нерегулярных вычислений, с которыми стандартные процессоры и графические ускорители справляются неэффективно.

Новый тип ячейки памяти

Чтобы сократить разрыв между алгоритмом и аппаратурой, авторы разработали базовый электронный элемент, который они называют гауссовоподобной ячейкой памяти. Каждая ячейка сочетает два наноразмерных компонента в серии: специальный транзистор с электрической характеристикой, поднимающейся и спадающей в гладкой колоколообразной кривой, и мемристор — устройство, сопротивление которого можно постоянно настраивать электрическими импульсами. Регулируя мемристор, команда может сдвигать и масштабировать колоколообразную характеристику транзистора, фактически программируя высоту и ширину гауссовоподобной кривой непосредственно в аппаратуре. Измерения показывают, что эти ячейки можно многократно перенастраивать, они сохраняют состояние длительное время и демонстрируют однородное поведение на множестве циклов и устройств — все это критично для построения надежных крупных матриц.

Преобразование ячеек в мозг «в памяти»

Следующий шаг — расположить тысячи таких ячеек памяти в матричных кроссбарных схемах. В такой компоновке ряды и столбцы проводников пересекаются в каждой ячейке: сигналы, подаваемые по столбцам, управляют поведением ячеек, а токи, собираемые по рядам, естественным образом суммируются согласно законам электричества. Это означает, что чип может выполнять ключевые операции сети Колмогорова–Арнольда — складывать множество гауссовоподобных функций для формирования гибкой функции активации — непосредственно там, где хранятся данные, без постоянной пересылки информации между отдельными процессорами и памятью. Дополнительная схемотехника позволяет представлять и суммировать положительные и отрицательные вклады, а опциональные остаточные пути повышают устойчивость глубоких сетей без замены основной вычислительной логики в памяти.

Испытание архитектуры

Используя детальные симуляции, привязанные к измеренному поведению устройств, авторы показывают, что сети, собранные из таких массивов ячеек памяти, справляются с широким кругом задач. Они успешно аппроксимировали сложные одномерные функции без забывания ранее выученных, распознавали рукописные цифры и предметы одежды, решали уравнения в частных производных и прогнозировали хаотические временные ряды. В этих задачах сети на гауссовых ячейках сохраняют ключевые преимущества сетей Колмогорова–Арнольда: высокую эффективность при относительно малом числе параметров и заметную способность избегать катастрофического забывания при дообучении на новых задачах. По сравнению с традиционными нейросетями, реализованными на аналогичном мемристивном оборудовании, новая архитектура часто демонстрирует лучшую точность и обобщающую способность при использовании более компактных промежуточных слоев.

Figure 2
Figure 2.

Экономия энергии и практические перспективы

Поскольку вычисления происходят внутри тех же элементов, которые хранят выученные параметры, предложенная архитектура в значительной мере устраняет дорогостоящий трафик между памятью и процессором, который является узким местом у современного ИИ-оборудования. Авторы оценивают, что их система на основе гауссовоподобных ячеек памяти может выполнять основные операции сетей Колмогорова–Арнольда примерно с двумя порядками величины большей энергоэффективностью, чем современные графические процессоры при эквивалентных алгоритмах. Проще говоря, работа описывает, как создать чипы, в которых каждое мелкое устройство может одновременно хранить и вычислять гибкие колоколообразные отклики, и где множество таких устройств работают параллельно. Это указывает путь к будущему нейроморфному оборудованию, которое обучается непрерывно, устойчиво к забыванию и запускает мощные модели ИИ при значительно меньшем энергопотреблении, чем существующие платформы.

Цитирование: Wen, Z., Zhang, Q., Chen, J. et al. Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells. Nat Commun 17, 3496 (2026). https://doi.org/10.1038/s41467-026-69592-w

Ключевые слова: нейроморфные вычисления, вычисления в памяти, сети Колмогорова–Арнольда, мемристорные устройства, энергоэффективное ИИ-оборудование