Clear Sky Science · ru

Неогеббановские синапсы для ускорения онлайн‑обучения нейроморфного оборудования

· Назад к списку

Обучение чипов на основе опыта

Современный искусственный интеллект чрезвычайно мощен, но по‑прежнему далёк от способности мозга учиться по разреженной и запоздалой обратной связи — например, запомнить, какой короткий путь через город действительно экономит время. В этой статье предлагается новый тип искусственного «синапса», соединяющего искусственные нейроны, который позволяет нейроморфным чипам обучаться более по‑мозговому, в режиме онлайн, оставаясь при этом компактным и энергоэффективным. Для тех, кто интересуется будущим аппаратного ИИ, в ней показано, как само тепло можно превратить в полезный сигнал для обучения внутри крошечных запоминающих устройств.

Почему нейроморфным мозгам нужны лучшие синапсы

Нейроморфные вычисления стремятся имитировать способы обработки информации в мозге: с помощью импульсных нейронных сетей, где короткие электрические импульсы проходят через обширные сети синапсов. Современное оборудование уже может реализовывать синапсы с помощью мемристивных компонентов, таких как ReRAM, электрическая проводимость которых может настраиваться для хранения веса. Тем не менее простые геббовские правила обучения — когда синапсы укрепляются или ослабляются только в зависимости от локального времени спайков — испытывают трудности на реальных задачах, требующих связывать события, разнесённые во времени, например распознавание речи или задачу навигации. Стандартные методы глубокого обучения решают это с помощью обратного распространения во времени, но этот подход требует слишком много памяти и энергии для аппаратуры, приближённой к мозгу. Поэтому сообщество обратилось к «трёхфакторным» правилам обучения и алгоритмам вроде eligibility propagation (e‑prop), которые вводят дополнительный локальный след — память на каждом синапсе, чтобы отложенный глобальный сигнал вознаграждения всё ещё мог скорректировать нужные соединения.

Figure 1
Figure 1.

Хранение затухающей памяти в тепле

Ключевая идея работы — «неоГеббановский» синапс с двумя внутренними переменными состояния: долгосрочным весом связи и краткосрочным следом‑eligibility, запоминающим недавнюю активность. Вес кодируется, как обычно, в проводимости ReRAM‑элемента. След eligibility, напротив, хранится в локальной температуре этого устройства, управляемой наномасштабным резистивным нагревателем, интегрированным непосредственно над или рядом с ним. Во время обычной обработки импульсов ReRAM просто умножает входные импульсы на хранимый вес. Во время обучения сигналы от нейронов, соответствующие «что сработало ранее» и «насколько чувствителен в настоящий момент постсинаптический нейрон», запускают ток через крошечный нагреватель. Поскольку нагреватель и ReRAM термически связаны, эта мощность повышает температуру устройства пропорционально произведению этих двух сигналов — математическому следу eligibility, требуемому алгоритмом e‑prop.

Как тепло меняет память

После того как короткая последовательность входов — называемая dataframe — обработана, накопленный подъём температуры кодирует, насколько «подходящ» этот синапс для изменения. Затем через ReRAM подаётся фиксированный программирующий импульс. Важно, что детальные эксперименты показывают: возникающее изменение проводимости сильно зависит от температуры — более горячие устройства меняются сильнее, а направление и величина изменения зависят от начального состояния проводимости и от того, подвергается ли устройство воздействию в сторону большей или меньшей проводимости. Тщательно выбирая амплитуды импульсов и используя эту чувствительность к температуре, авторы добиваются того, чтобы изменение веса было примерно пропорционально хранимому следу eligibility. Численные модели теплопереноса в 3D‑интегрированном стеке нагреватель‑плюс‑ReRAM подтверждают, что температуру можно повысить и позволить ей затухать на настраиваемых временных масштабах, а также что структуру можно сконструировать так, чтобы усиливать желаемый самонагрев и ограничивать тепловое «перекрёстное влияние» на соседние синапсы.

Figure 2
Figure 2.

Тестирование термических синапсов

Чтобы оценить, полезен ли этот экзотический синапс на практике, авторы моделируют полные нейроморфные системы, включающие реалистичные поведенческие особенности устройств, такие как затухание температуры, вариабельность между устройствами и ограниченная точность. В одной демонстрации импульсная сеть управляет виртуальной мышью, которая должна научиться перемещаться по сетковой лабиринтовой карте, чтобы найти сыр, избегая ловушек. Здесь естественное термическое охлаждение — которое медленно стирает накопленный след eligibility — действует как «коэффициент дисконтирования», знакомый из обучения с подкреплением: недавние пары состояние‑действие важнее древних. Моделирование показывает, что обучение идёт быстрее, когда это затухание не слишком быстрое и не слишком медленное, а вариабельность в поведении ReRAM лишь постепенно ухудшает результаты. В более требовательном тесте рекуррентная импульсная сеть с термическими неоГеббановскими синапсами обучается онлайн на бенчмарке классификации фонем TIMIT, стандартной задаче распознавания речи. При достаточном разрешении проводимости (примерно эквивалент 8‑бит) моделирование с учётом особенностей аппаратуры достигает точности в пределах нескольких процентов от идеальной реализации с плавающей точкой.

Что это значит для будущего аппаратного ИИ

В целом исследование демонстрирует, что локальная температура может служить практической, управляемой внутренней памятью для продвинутых правил обучения, позволяя быстрое обучение прямо на кристалле без массивных цифровых накладных расходов. Предложенный синапс занимает примерно ту же площадь, что и обычная ячейка ReRAM, но реализует и стабильный вес, и затухающий след, а его энергетическая стоимость на шаг обучения находится в диапазоне пико́джоулей. Хотя использование тепла порождает реальные проблемы — температуру трудно измерить напрямую, и она может ускорять износ устройств — работа указывает, что принятие, а не борьба с электроприменяемыми тепловыми эффектами может открыть новые классы компактного обучающегося оборудования. Для неспециалистов ключевая мысль такова: будущие ИИ‑чипы могут не только перемещать электроны — они также смогут вычислять с помощью тщательно спроектированных тепловых паттернов, приблизив машинное обучение к эффективности и адаптивности человеческого мозга.

Цитирование: Pande, S., Bezugam, S.S., Bhattacharya, T. et al. NeoHebbian synapses to accelerate online training of neuromorphic hardware. Sci Rep 16, 6836 (2026). https://doi.org/10.1038/s41598-026-35641-z

Ключевые слова: нейроморфные вычисления, импульсные нейронные сети, синапс ReRAM, онлайн‑обучение, аппаратно‑эффективный ИИ