Clear Sky Science · ru

Вычислительные одноклеточные механизмы кодирования визуальных объектов в височной доле человека

· Назад к списку

Как мозг понимает, на что мы смотрим

Каждый раз, когда вы бросаете взгляд на людную улицу, ваш мозг мгновенно определяет, какие формы принадлежат людям, какие — автомобилям, а какие — знакам, даже если они частично скрыты или странно освещены. В этой статье задаётся обманчиво простой вопрос: как человеческий мозг превращает поток сырых визуальных данных, попадающих в глаза, в устойчивые понятия вроде «собака» или «чашка», которые мы можем узнавать, запоминать и называть?

Figure 1
Figure 1.

От детализированных изображений к значимым предметам

Учёные знают, что распознавание объектов в значительной степени опирается на цепочку областей на нижней поверхности мозга, называемую вентральным зрительным путём. На ранних этапах обрабатываются простые признаки, такие как края и текстуры, в то время как на поздних этапах важнее целые объекты и их значение. У людей ключевой участок этого пути — вентральная височная кора (VTC), а чуть дальше расположен мезальный отдел височной доли (MTL), который играет решающую роль в памяти. Загадкой было то, как мозг переходит от детализированных, похожих на картинку описаний VTC к разреженным, похожим на понятия кодам MTL, где немного нейронов может представлять многие разные виды одного и того же объекта.

Нейронная карта пространства объектов

Авторы записывали электрическую активность непосредственно из мозга пациентов с эпилепсией, у которых уже были имплантированы электроды в медицинских целях. Пока пациенты выполняли простую задачу, они просматривали сотни природных изображений из множества категорий — животных, инструментов, продуктов питания, транспортных средств, растений и др. В VTC исследователи обнаружили, что ответы можно описать как комбинации нескольких ключевых направлений признаков, или «осей», например насколько объект выглядит естественным vs созданным человеком, или насколько он одушевлённый vs неодушевлённый. Путём математического комбинирования этих осей они построили «нейронное пространство признаков», в котором каждое изображение занимает своё положение, и похожие объекты группируются вместе, даже если различаются по низкоуровневым деталям.

От плотных сеток признаков к разреженным узлам понятий

В этом нейронном пространстве VTC действует как плотная сетка: многие участки участвуют в представлении каждого объекта, кодируя тонкие визуальные различия. Напротив, нейроны, записанные поодиночке в MTL, вели себя совсем иначе. Вместо отслеживания отдельных признаков многие из этих клеток сильнее реагировали только на объекты, попадающие в определённые области VTC-пространства признаков. Каждому такому нейрону фактически соответствовало «рецептивное поле» не в физическом пространстве, а в этой абстрактной карте свойств объектов. Объекты, попадавшие в предпочитаемую область нейрона, часто имели как перцептуальные черты (например округлые формы или зелёные оттенки), так и более высокоуровневые значения (например живые существа или инструменты), из-за чего такой нейрон стрелял разреженно, но выборочно.

Figure 2
Figure 2.

Связывание зрения и памяти

Чтобы показать, что это не просто математический трюк, команда изучила, как эти участки мозга взаимодействуют в реальном времени. Они обнаружили, что участки VTC, несущие сильные сигналы по осям признаков, особенно синхронизированы с категориячувствительными участками MTL, особенно в определённых ритмических мозговых волнах. Информация, как правило, текла из VTC в MTL на более низких частотах, ассоциированных с прямой обработкой, в то время как обратная связь от MTL к VTC приходила на немного более высоких частотах. Критически важно то, что когда нейрон MTL был настроен на конкретную область пространства признаков, его спайки выстраивались по быстрому ритму в VTC, и это сопряжение было сильнее для тех изображений, которые этот нейрон кодировал. Второй набор экспериментов с другой коллекцией изображений подтвердил, что и карта признаков VTC, и настройка регионов MTL остаются стабильными при смене стимулов.

Почему это важно для повседневного видения и запоминания

Вместе эти результаты поддерживают конкретную вычислительную картину: VTC раскладывает визуальные объекты по значимым осям признаков, формируя богатый, непрерывный ландшафт, а MTL ставит небольшие, селективные «указатели» на области этого ландшафта. Эта трансформация превращает подробный, распределённый образ-код в разреженный код-понятие, который легче хранить, извлекать и комбинировать с другими воспоминаниями. Для неспециалиста вывод таков: распознавание собаки в дождливую ночь — это не простая операция поиска, а результат многоуровневого, совместного процесса, в котором одна часть мозга строит структуру внешнего вида, а другая учится отмечать и считывать области этой карты как отдельные, стойкие представления.

Цитирование: Cao, R., Zhang, J., Zheng, J. et al. Computational single-neuron mechanisms of visual object coding in the human temporal lobe. Nat Commun 17, 2234 (2026). https://doi.org/10.1038/s41467-026-68954-8

Ключевые слова: распознавание объектов, вентральная височная кора, мезальная височная доля, нейронное кодирование, визуальная память