Clear Sky Science · ru

Нейронные и вычислительные механизмы одноразового перцептивного обучения у человека

· Назад к списку

Увидеть скрытое изображение

Многие испытывали тот внезапный момент «ага!», когда смутное чёрно‑белое пятно вдруг превращается в ясный образ собаки или лица — и как только вы его увидели, уже нельзя не видеть. В этом исследовании спрашивают, как одно короткое пробное рассмотрение ясного изображения может навсегда изменить то, что мы видим в неоднозначной версии, и что это раскрывает о том, как наши мозги — и будущие системы искусственного интеллекта — учатся по одному примеру.

Figure 1
Figure 1.

От размытых пятен к мгновенному распознаванию

Исследователи использовали классические «Mooney‑изображения»: сильно упрощённые чёрно‑белые картинки, которые трудно распознать, пока не покажешь исходную градационную фотографию. Добровольцы сначала пытались назвать то, что они видят на этих сложных изображениях. Позже им кратко показывали соответствующие чёткие фото, а затем снова предлагали трудные изображения. После этого единственного показа люди внезапно научились узнавать прежде загадочные картинки, и улучшение сохранялось. Тщательно изменяя ясные фотографии — зеркально переворачивая, поворачивая, меняя масштаб или смещая их на экране — команда выяснила, какой тип визуальной информации мозг фактически сохраняет при таком одноразовом обучении.

Где мозг хранит новое озарение

Разные изменения картинок по‑разному влияли на обучение. Увеличение или уменьшение ясного изображения вдвое не вредило обучению, что говорит о гибкости по отношению к размеру хранимого «шаблона». Но зеркальное отражение, поворот или смещение изображения на экране ослабляли обучение, хотя не делали его невозможным. Замена ясной фотографии другим примером той же категории — например, другой собакой — полностью устраняла эффект обучения. Это показывает, что мозг не просто сохраняет идею «это собака», а хранит подробное, картиноподобное представление конкретной формы и расположения именно этого изображения. Сочетая эти поведенческие результаты с известными сведениями о зрительной системе, исследователи указали на высокоуровневые зрительные области, а не на ранние зрительные регионы или структуры памяти вроде гиппокампа, как на вероятное место хранения этого нового знания.

Наблюдая за обучением внутри мозга

Чтобы подтвердить это, команда использовала сверхвысокопольные МРТ‑сканирования на 7 Тесла и прямые записи с электродов, помещённых на мозга пациентов с эпилепсией. Эксперименты МРТ показали, что нейроны в области, называемой высокоуровневой зрительной корой, реагировали на разные версии одного и того же объекта (изменённые по размеру, положению или ориентации) именно так, как предсказывали поведенческие тесты. В записях с электродов критическое изменение появлялось сначала в этой высокоуровневой зрительной коре: после обучения паттерны активности, вызванные трудным изображением, становились более похожими на те, что вызывало его ясное соответствие, и это происходило раньше здесь, чем в первичных зрительных областях. Такое временное соотношение указывает на то, что именно эта область хранит и реактивирует новый «априор», а затем посылает обратную (top‑down) связь в более ранние зрительные области, помогая интерпретировать шумный ввод.

Figure 2
Figure 2.

Создание машины, которая учится с одного показа

Исследователи также создали модель глубокой нейронной сети, призванную имитировать эту способность. Их система использовала современный визуальный трансформер в роли «снизу‑вверх» зрительного движка и специальный модуль для хранения априорной информации, который посылает «сверху‑вниз» обратную связь при последующем появлении связанного изображения. Обученная на задачах типа Mooney, модель продемонстрировала подлинное обучение с одного показа: её точность резко возрастала после одного появления ясного изображения и значительно превосходила то, что можно было бы объяснить простой репетицией. Модель даже имела многие те же успехи и неудачи на отдельных изображениях, что и люди, а внутренние признаки, которые она извлекала из ясных изображений, могли предсказывать, какие картинки люди будут или не будут учиться распознавать. Сравнение хранимого априора модели с данными сканирования человеческого мозга выявило наибольшее сходство в тех же высокоуровневых зрительных областях, отмеченных экспериментами.

Почему это важно для мозгов и машин

В сумме эти результаты предполагают, что наши внезапные «теперь я вижу!»‑моменты возникают, когда высокоуровневые зрительные области быстро настраивают свои связи после одного опыта, сохраняя подробный картиноподобный априор, который затем может изменить то, как мы интерпретируем зашумлённую информацию. Эта быстрая, но устойчивая форма обучения, укоренённая в высокоуровневой зрительной коре и поддерживаемая сверху‑вниз связью, даёт план для создания ИИ‑систем, которые могут учиться с очень малого числа примеров. Она также служит отправной точкой для понимания того, что может пойти не так, когда восприятие слишком сильно опирается на априорные ожидания, как в некоторых психиатрических состояниях, сопровождающихся галлюцинациями.

Цитирование: Hachisuka, A., Shor, J.D., Liu, X.C. et al. Neural and computational mechanisms underlying one-shot perceptual learning in humans. Nat Commun 17, 1204 (2026). https://doi.org/10.1038/s41467-026-68711-x

Ключевые слова: обучение с одного примера, визуальное восприятие, высокоуровневая зрительная кора, перцептивное обучение, глубокие нейронные сети