Clear Sky Science · ru

Местные латеральные связи достаточны для воспроизведения кортикоподобной топографической организации в глубоких нейронных сетях

2026-03-17 · Назад к списку

Почему в ИИ важны карты, похожие на мозговые

Наши мозги располагают нейроны с похожими функциями рядом друг с другом, формируя упорядоченные карты для таких признаков, как края, лица и места. Эта схема встречается у многих видов и в различных областях мозга, но учёные до сих пор спорят, зачем она нужна и как возникает. В этом исследовании ставится вопрос: может ли простое правило проводки — позволить соседним нейронам взаимодействовать друг с другом — привести к тому, что искусственные сети сами по себе вырастят похожие карты, и приносит ли такая организация практическую выгоду, например более устойчивое восприятие в шумной среде.

Узоры на поверхности коры

У приматов зрительная кора — не бессистемная масса клеток. Напротив, она устроена как лоскутное одеяло, где соседние нейроны склонны предпочитать схожие визуальные признаки. Ранние области содержат карты ориентации линий и цвета; более поздние — участки, настроенные на лица, тела, сцены или повседневные объекты. Классические теории предлагают, что такой порядок эволюционировал ради сокращения длины проводки и эффективности, но обычно они опираются на специальные правила обучения или дополнительные цели, которые трудно оправдать биологически. Авторы же сосредотачиваются на более базовой анатомической особенности, широко распространённой в коре: коротких боковых связях между соседними нейронами, часто более сильных между клетками, уже откликающимися похоже.

Построение виртуального листа коры

Исследователи начинают со стандартной модели глубокого зрения, ResNet18, и реорганизуют её единицы так, чтобы каждая занимала фиксированную позицию на двумерном «кортикальном листе». В пределах каждого слоя они добавляют локальные латеральные связи, сила которых убывает с расстоянием, имитируя то, что соседние кортикальные нейроны сильнее влияют друг на друга, чем удалённые. Эти боковые связи не обучаются градиентным спуском; обучаются только обычные прямые (feedforward) веса. Модель затем изучает одну задачу — распознавание объектов на большом наборе изображений — с помощью стандартного обратного распространения ошибки, без дополнительного члена, который напрямую поощрял бы сглаженные карты или короткую проводку.

Мозгоподобные карты от краёв до лиц

Даже при такой простой установке возникает богатая топография. На ранних слоях единицы формируют плавные карты ориентации, пространственной частоты и цвета, напоминающие наблюдения в первичной зрительной коре. Соседние единицы откликаются более схоже, чем удалённые, а направления, вдоль которых меняются ориентация и пространственная частота, склонны пересекаться под прямыми углами, что перекликается с тонкими данными животных. Когда в первом слое устраняют совместное использование весов для большей биологической правдоподобности, модель также воспроизводит характерные элементы, такие как «шпильковые» (pinwheel) структуры в картах ориентации. В более глубоких слоях появляются кластеры, настроенные на категории вроде лиц, тел и сцен, расположенные в удлинённых поясах по симулированному листу, что тесно соответствует известным схемам в вентральной височно‑темпоральной области человека. Модель даже воспроизводит более широкие деления, например отдельные потоки для одушевлённого и неодушевлённого и для маленьких и больших объектов в реальном мире.

Неизученные области коры и экономия проводки

Работа выходит за рамки знакомых «горячих точек», чтобы исследовать области с менее определённой функцией. Используя данные высокоразрешающей мозговой визуализации, авторы выделяют промежуточный участок человеческой коры, расположенный между областями, селективными к лицам и к местам. В их модели единицы, чья активность лучше всего согласуется с этим участком, занимают промежуточные позиции между соответствующими кластерами, настроенными на лица и сцены, что указывает на то, что искусственная топография обобщается и на неизведанные территории. Они также оценивают эффективную длину проводки между сильно активными единицами через слои. Удивительно, что сети с латеральными связями в итоге имеют значительно меньшую общую длину соединений, чем как исходная нетопографическая сеть, так и предыдущая модель, явно оптимизированная для минимизации проводки, что подразумевает: реалистичное обучение само по себе может приводить к экономичным раскладкам, если архитектура включает локальную латеральную структуру.

Устойчивое зрение через локальное сотрудничество

Одно из самых интригующих наблюдений — функциональное: кластерная карта делает модель труднее обмануть. Когда изображения намеренно искажают сильными адверсиальными атаками — крошечными изменениями пикселей, созданными для введения классификатора в заблуждение — сети с локальными латеральными связями сохраняют более высокую точность по сравнению с базовой моделью, особенно когда боковые связи охватывают более широкое соседство. Авторы интерпретируют кластеры как ансамбли схожих единиц, которые усредняют шум, подобно методам ансамблей в машинном обучении. Это указывает на то, что топография может быть не только следствием аккуратной проводки: она также может поддерживать стабильное, надёжное восприятие, позволяя группам соседних нейронов сотрудничать.

Что это значит для мозга и машин

Исследование показывает, что простое добавление реалистичных локальных латеральных связей в глубокую сеть достаточно, чтобы на нескольких масштабах возникали кортикоподобные карты, без специальных правил обучения, которые нейроны вряд ли реализуют. При этом такая организация улучшает устойчивость и сокращает суммарную проводку, что намекает на то, что эволюция могла благоприятствовать топографии ради и эффективности, и надёжного восприятия. Для нейронаук модель предлагает единый рецепт схемы цепи, объясняющий разнообразные визуальные карты; для искусственного интеллекта она указывает направление в сторону архитектур, которые не только ближе к мозгу по конструкции, но и более устойчивы к шумным или адверсиальным входам.

Цитирование: Qian, X., Dehghani, A.O., Farahani, A.B. et al. Local lateral connectivity is sufficient for replicating cortex-like topographical organization in deep neural networks. Nat Commun 17, 4042 (2026). https://doi.org/10.1038/s41467-026-70065-3

Ключевые слова: кортикальная топография, латеральная связность, глубокие нейронные сети, зрительная кора, адверсиальная устойчивость