Clear Sky Science · ru

Векторизованные обучающие сигналы в корковых дендритах

2026-02-25 · Назад к списку

Как мозг учится у собственных нейронов

Современные программы искусственного интеллекта обучаются, аккуратно настраивая миллионы крошечных связей так, чтобы каждый нейрон в сети получал свой собственный обучающий сигнал. Нейробиологи давно задавались вопросом, есть ли у биологического мозга сопоставимый способ сообщать отдельным нейронам, как им изменяться в процессе обучения. Это исследование показывает, что ответ — да: у мышей, по-видимому, используются особые сигналы в тонких ветвях их клеток мозга, которые направляют обучение, предлагая биологический аналог ключевых идей машинного обучения.

Преобразование мысли в движущееся изображение

Чтобы сделать процесс обучения видимым, исследователи создали интерфейс «мозг–компьютер» для мышей. Пока мышь бегала на небольшом беговом колесе, микроскоп заглядывал в участок её мозга, участвующий в навигации и памяти. Учёные выбрали два маленьких набора нейронов в этой области и связали их активность с дрейфующим полосатым узором на экране. Когда одна группа нейронов становилась активнее другой, узор поворачивался в сторону заданной «целевой» ориентации, и мышь получала сладкое вознаграждение. Таким образом экспериментаторы задали точное правило, связывающее активность каждого нейрона с успехом или неудачей.

Две популяции, противоположные функции

Две группы нейронов были перемешаны в одном и том же участке коры, но они оказывали противоположное влияние на стимул: одна сдвигала узор в сторону угла, приносящего вознаграждение, другая — отталкивала его. Примерно за две недели тренировки мыши научились получать больше вознаграждений в минуту и успешнее выполнять задания. Одновременно «полезные» нейроны обычно продолжали сильно активироваться, тогда как «неполезные» со временем стали реже стрелять. Это изменение не отражало просто глобальные сдвиги возбуждения или скорости бега; напротив, оно соответствовало тому, как активность каждого нейрона влияла на результат задачи, намекая на то, что мозг решал тонкую проблему назначения кредитов.

Прослушивание скрытых концов нейронов

Критически важно, что команда наблюдала не только тела этих нейронов, но и их длинные, древовидные ветви — апикальные дендриты. Эти ветви располагаются ближе к поверхности мозга и получают другие входы, чем тело клетки. Быстро переключаясь между глубокими и поверхностными плоскостями визуализации, исследователи записывали активность и в тех, и в других местах одной и той же клетки. Они обнаружили, что когда нейрон активируется, сила сигнала в его дендритах может быть либо больше, либо меньше ожидаемого по сравнению с сигналом в соме, и что эти расхождения частично предсказуемы по активности соседних нейронов. Это означает, что дендриты не просто пассивно повторяли сомальные сигналы; они получали отдельную информацию от окружающей сети.

Дендриты несут сигналы вознаграждения и ошибки

Следующим вопросом было, что означают эти дендритные сигналы. Анализируя время появления событий относительно вручения награды и исхода испытания, авторы показали, что шаблоны дендритного усиления у многих нейронов могли отличать вознаграждённые от не вознаграждённых испытаний и успешные попытки от неудачных, даже до того, как исход стал известен. Другими словами, дендритные сигналы несли информацию как о вознаграждении, так и об актуальной ошибке выполнения, которая, в принципе, могла служить обучающим сигналом. Поразительно, что знак этих сигналов зависел от причинной роли нейрона: дендриты нейронов, которые помогали уменьшить ошибку, усиливались при снижении ошибки, тогда как дендриты нейронов, сдвигающих узор в неверном направлении, усиливались при увеличении ошибки. Этот «векторизованный» рисунок напоминает то, как искусственные сети посылают разные сообщения об ошибке разным элементам.

Выключение канала обучения

Чтобы проверить, имеют ли эти дендритные паттерны значение для обучения, исследователи использовали светочувствительные белки для активации специфического класса ингибирующих клеток, которые располагаются в самом внешнем слое коры и нацеливаются на апикальные дендриты. Включение этих ингибирующих клеток сильно ослабляло дендритные расхождения по отношению к соматической активности. В таких условиях популяция дендритов больше не сигнализировала надёжно о вознаграждении или исходе испытания, и мыши не улучшали свои показатели в задаче «мозг–компьютер», хотя базовая установка оставалась без изменений. Похожие эффекты наблюдались под анестезией, когда известно, что нисходящие входы подавляются, что дополнительно поддерживает идею о том, что эти дендритные сигналы зависят от специализированных путей обратной связи.

Что это означает для понимания обучения

В совокупности результаты указывают на то, что мозг использует отдельные электрические компартменты внутри отдельных нейронов для маршрутизации обучающих сигналов, аналогично тому, как искусственные сети направляют сигналы ошибки к конкретным элементам. Апикальные дендриты корковых нейронов, по-видимому, несут специфичную для нейрона информацию об изменениях вознаграждения и ошибки, и вмешательство в этот канал блокирует обучение. Для неспециалиста главный вывод заключается в том, что обучение в мозге может зависеть не только от того, какие нейроны активны, но и от того, как их скрытые ветви интегрируют обратную связь от остальной сети — предлагая биологический план некоторых ключевых идей современного машинного обучения.

Цитирование: Francioni, V., Tang, V.D., Toloza, E.H.S. et al. Vectorized instructive signals in cortical dendrites. Nature 652, 1254–1263 (2026). https://doi.org/10.1038/s41586-026-10190-7

Ключевые слова: дендритные вычисления, назначение кредитов, интерфейс мозг–компьютер, кортикальное обучение, нейрофидбек