Clear Sky Science · ru

Постоянное представление предыдущей схемы в орбитофронтальной коре облегчает усвоение конфликтующей схемы

2026-02-10 · Назад к списку

Почему мысленные сокращения могут как помогать, так и мешать

Повседневная жизнь опирается на мысленные сокращения: однажды выучив правила вождения или пользования новым приложением, вы можете применять эти знания в новых ситуациях. Но те же сокращения, называемые схемами, способны вводить в заблуждение, когда правила внезапно меняются — например, при вождении в стране, где движение по другой стороне дороги. В этом исследовании задаются вопросом, как мозг управляет старыми и новыми наборами правил, которые конфликтуют между собой, и помогает ли удерживание старой схемы или, наоборот, мешает усвоению новой.

Обучение крыс переключаться между конфликтующими правилами

Исследователи обучали крыс серии задач на выбор, основанных на запахах, которые внешне выглядели одинаково, но подчинялись разным скрытым правилам. На первом этапе крысы усвоили правило «сравнивать с предыдущим испытанием»: они получали сахарную воду только если текущий запах отличался от предыдущего. После освоения этого правила их переводили на второй этап, где использовались те же запаховые сигналы, но теперь вознаграждение зависело только от идентичности запаха, а не от сравнения с предыдущим испытанием. Новое «правило идентичности» напрямую конфликтовало с ранее изученным правилом сравнения. Отдельная контрольная группа крыс с самого начала изучала только правило идентичности, поэтому их мозгу не приходилось одновременно удерживать предыдущее правило сравнения.

Как область принятия решений в мозге отслеживает скрытые правила

Пока крысы изучали и переключались между правилами, команда регистрировала активность отдельных нейронов и больших групп клеток в области принятия решений, называемой орбитофронтальной корой, расположенной прямо над глазами. По мере того как крысы сначала осваивали правило сравнения, все больше нейронов орбитофронтальной коры начинали по‑разному реагировать на вознаграждаемые и не вознаграждаемые испытания, а активность популяции четко разделяла испытания в соответствии с правилом. Когда ввели правило идентичности, эта область мозга быстро перестроилась так, что ее активность теперь группировала запахи по тому, вознаграждаются они по новому правилу или нет. Существенно, однако, следы старого правила сравнения не исчезли: многие нейроны и общая картина активности продолжали нести информацию о том, было бы испытание вознаграждено по старому правилу, даже когда поведение полностью соответствовало новому. Контрольные крысы, никогда не изучавшие правило сравнения, проявляли мало или вовсе не проявляли такого «призрачного» сигнала.

Старые и новые схемы хранятся бок о бок, а не перезаписываются

Более детальный анализ показал, что нейроны орбитофронтальной коры склонны к специализации: большинство сигнализировали о вознаграждении или его отсутствии либо для старого, либо для нового правила, но не для обоих одновременно. На уровне популяции активность для двух правил можно было считывать вдоль в значительной степени отдельных «осей», то есть эта область мозга фактически содержала два перекрывающихся, но частично независимых представления задачи. Классификаторы, обученные на нейронных данных, надежно декодировали и текущее действующее правило, и то, каким был бы исход по альтернативному правилу. Иными словами, вместо того чтобы стирать предыдущую схему, орбитофронтальная кора поддерживала ясное, параллельное представление о ней, одновременно формируя новое.

Когда точная память о старом правиле помогает учить новое

Ключевым и неожиданным оказался поведенческий результат: более сильное нейронное представление старого, ныне неактуального правила не заставляло крыс цепляться за него. По мере обучения крысы становились лучше в игнорировании предсказаний старого правила, даже в испытаниях, где оно предсказывало «вперед», и это улучшение было наибольшим у животных, у которых активность орбитофронтальной коры наиболее четко кодировала старое правило. Те же животные быстрее осваивали новое правило идентичности, хотя они не были лучшими учениками на первом этапе. Когда исследователи временно заглушали нейроны орбитофронтальной коры во время консолидации первой схемы в отдельном эксперименте, крысы позже с трудом обобщали старое правило на новые запахи и испытывали затруднения с усвоением нового, конфликтующего правила. Это указывает на то, что активное представление исходной схемы в орбитофронтальной коре подготавливает мозг к последующей гибкости.

Что это означает для гибкого мышления и умных машин

Для непрофессионала главный вывод таков: цепи принятия решений в мозге не просто перезаписывают старые знания при смене правил. Вместо этого орбитофронтальная кора сохраняет подробный след предыдущих схем в фоновом режиме, одновременно строя новый набор правил в частично отдельном канале. Такое параллельное хранение, по-видимому, поддерживает, а не препятствует гибкому поведению: сохраняя точную модель «как раньше работало», мозг лучше обнаруживает, когда эта модель не соответствует реальности, и быстрее приспосабливается к новым требованиям. Авторы предполагают, что эта стратегия — поддерживать сразу несколько карт правил и выборочно подавлять или использовать их — может послужить источником идей для систем искусственного интеллекта, которые избегают катастрофического забвения и учатся новым задачам, не стирая уже известного.

Цитирование: Maor, I., Atwell, J., Ascher, I. et al. Persistent representation of a prior schema in the orbitofrontal cortex facilitates learning of a conflicting schema. Nat Commun 17, 2610 (2026). https://doi.org/10.1038/s41467-026-69330-2

Ключевые слова: схемы, орбитофронтальная кора, когнитивная гибкость, обучение с подкреплением, нейронные представления