Clear Sky Science · ru

Дезинhibition (ослабление торможения) вентральной чёточной области во время начального формирования наказания вызывает стойкую нечувствительность к наказанию

2026-02-17 · Назад к списку

Почему мы порой игнорируем плохие последствия

Большинство из нас быстро учится прекращать действия, которые приносят боль или неприятности. Тем не менее некоторые люди и многие животные продолжают гнаться за наградой, даже когда цена высока — как при зависимости или рискованных решениях. В этом исследовании изучают, что происходит в ключевом центре вознаграждения мозга в первые моменты, когда мы узнаём, что действие имеет болезненные последствия, и как нарушение этого процесса может оставить нас упрямо нечувствительными к наказанию долгое время после того, как опасность стала очевидной.

Нейронный центр для оценки выгоды и вреда

Глубоко в среднем мозге располагается вентральная покрышечная область (VTA) — небольшая зона, чьи дофаминергические клетки посылают мощные «учебные сигналы» о наградах. Эти нейроны резко активируются, когда события оказываются лучше ожидаемого, и затихают, когда исход хуже. Их окружают ингибирующие клетки, использующие ГАМК (GABA), которые коротко подавляют дофаминовую передачу. Классические теории утверждают, что это торможение помогает животным научиться избегать вредных действий. Но исследователям было неизвестно, как именно сигналы ГАМК и дофамина в этой области ведут себя при наказании и действительно ли кратковременное подавление дофаминовых клеток необходимо для обучения избеганию опасности.

Наблюдая сигналы наказания в реальном времени

Авторы обучали крыс нажимать две рычажные рамки ради пищи. Позже нажатия на один рычаг также вызывали лёгкий электрический удар, превращая это действие в наказуемый выбор, в то время как другой рычаг оставался безопасным. С помощью волоконно-оптических методов команда измеряла активность дофаминовых клеток и входящую к ним ГАМК-сигнализацию, пока животные испытывали удары и награды и решали, какой рычаг нажать. Как дофаминовая активность, так и ГАМК-входы кратковременно всплывали при появлении пищи или удара. Дофаминовые клетки реагировали сильнее на пищу, тогда как ГАМК-вход особенно сильно активировался при ударах в самой первой сессии наказания, а затем ослабевал с опытом. Вокруг самих действий паттерны активности менялись так, что нажатия на наказуемый рычаг начали вызывать отдельный всплеск дофаминовой активности, тогда как безопасный рычаг — нет. Эти закономерности указывали на то, что всплеск ГАМК-опосредованного торможения именно при первом столкновении с наказанием может служить важным учебным сигналом.

Блокирование торможения в критическое окно

Чтобы проверить эту идею, исследователи вмешались в способность ГАМК ингибировать клетки в VTA. У одной группы крыс они вводили препарат локально в эту область, блокирующий ГАМК-А рецепторы в течение первых двух сессий наказания. У другой группы использовали технику дизайнерских рецепторов, чтобы искусственно возбуждать дофаминовые нейроны в те же ранние сессии. В обоих случаях немедленным эффектом было то, что крысы меньше сокращали число нажатий на наказуемый рычаг по сравнению с контрольными животными и в итоге получали больше ударов. Поразительно, что после истечения этого раннего окна восстановление нормальной химии мозга не устраняло проблему: даже в последующие дни без препаратов эти крысы продолжали охотнее нажимать на наказуемый рычаг и реже колебались перед этим.

Долговременные изменения в оценке опасности

Когда обучение наказанию уже было хорошо установлено, временное блокирование торможения или возбуждение дофаминовых клеток больше не вызывало таких же долгосрочных нарушений. Манипуляции на более позднем этапе могли сдвинуть общие уровни активности, например сделать животных более или менее подвижными, но они не стирали выученную склонность избегать наказуемый рычаг. Дополнительные тесты показали, что лечение не просто сделало награды в целом более привлекательными: погоня за непокараной пищей не увеличивалась стабильно. Скорее, нарушение казалось специфическим для того, как мозг связывал конкретное действие с его болезненным исходом при первой встрече, оставляя у животных долгосрочную «слепую зону» относительно этой опасности.

Что это значит для реальных рискованных решений

Для непрофессионального читателя вывод таков: похоже, существует короткое, но мощное окно обучения — прямо в момент, когда мы впервые сталкиваемся с тем, что выбор имеет вредные последствия — в течение которого точное торможение в одном из центров вознаграждения мозга учит нас отступать. Если этот ингибирующий сигнал ослаблен и дофаминовая активность остаётся высокой, мозг может не заметить опасность должным образом, что приводит к устойчивой склонности продолжать рискованный выбор, даже когда это причиняет вред. Поскольку многие наркотики усиливают дофамин или уменьшают его торможение, эти результаты предлагают механизм, посредством которого такие вещества могут настраивать мозг на стойкие, нечувствительные к наказанию привычки — и намекают на то, что защита или восстановление этого раннего учебного сигнала может быть ключом к тому, чтобы помочь людям переобучиться избегать вредного поведения.

Цитирование: Tan, S.Y.S., Shen, M.H., Keevers, L.J. et al. Disinhibition of ventral tegmental area during initial punishment learning causes enduring punishment insensitivity. Neuropsychopharmacol. 51, 1045–1055 (2026). https://doi.org/10.1038/s41386-026-02368-4

Ключевые слова: дофамин, обучение наказанию, вентральная покрышечная область, зависимость, рисковое поведение