Clear Sky Science · pl

Odhamowanie okolicy brzusznej nakrywki podczas początkowego uczenia się kary powoduje trwałą niewrażliwość na karę

2026-02-17 · Powrót do spisu

Dlaczego czasem ignorujemy złe konsekwencje

Większość z nas szybko uczy się przestawać robić rzeczy, które przynoszą ból lub kłopoty. Jednak niektórzy ludzie i wiele zwierząt nadal dąży do nagrody, nawet gdy koszt jest wysoki — jak w przypadku uzależnień czy ryzykownych decyzji. To badanie pyta, co dzieje się w jednym z kluczowych ośrodków nagrody w mózgu w pierwszych chwilach, gdy uczymy się, że dane działanie ma bolesne konsekwencje, i jak zaburzenie tego procesu może sprawić, że pozostaniemy uparcie niewrażliwi na karę długo po ustąpieniu bezpośredniego zagrożenia.

Węzeł mózgu do ważenia nagrody wobec szkody

Głęboko w śródmózgowiu leży okolica brzuszna nakrywki (ventral tegmental area, VTA), niewielki obszar, którego komórki uwalniające dopaminę wysyłają silne „sygnały uczące” dotyczące nagród. Neurony te wybuchają aktywnością, gdy wynik jest lepszy niż oczekiwano, i cichną, gdy wynik jest gorszy. Otaczają je komórki hamujące, które używają GABA do krótkotrwałego wyciszania wydzielania dopaminy. Klasyczne teorie sugerują, że ta inhibicja pomaga zwierzętom uczyć się unikać szkodliwych działań. Jednak badacze nie wiedzieli dokładnie, jak sygnały GABA i dopaminy w tym obszarze zachowują się podczas karania, ani czy krótkie wyciszenie komórek dopaminowych jest rzeczywiście niezbędne do nauki omijania zagrożenia.

Obserwowanie sygnałów kary w czasie rzeczywistym

Autorzy wyszkolili szczury do naciskania dwóch dźwigni w celu otrzymania jedzenia. Później naciśnięcia jednej z dźwigni wywoływały także łagodny wstrząs elektryczny, przemieniając to działanie w karaną opcję, podczas gdy druga dźwignia pozostała bezpieczna. Za pomocą narzędzi do nagrań światłowodowych zespół mierzył aktywność komórek dopaminowych oraz napływ GABA, który do nich docierał, gdy zwierzęta doświadczały wstrząsów i nagród oraz decydowały, którą dźwignię nacisnąć. Zarówno aktywność dopaminy, jak i dopływ GABA chwilowo wzrastały w momencie pojawienia się jedzenia lub wstrząsu. Komórki dopaminowe reagowały silniej na jedzenie, podczas gdy napływ GABA był szczególnie mocny przy wstrząsach podczas pierwszej sesji karania, a następnie malał wraz z doświadczeniem. Wokół samych działań wzorce aktywności przesuwały się tak, że naciskania na karaną dźwignię zaczęły wywoływać wyraźny wybuch aktywności dopaminowej, podczas gdy bezpieczna dźwignia tego nie robiła. Te wzorce sugerowały, że gwałtowny napływ inhibicji zależnej od GABA właśnie w chwili pierwszego zetknięcia się z karą może być kluczowym sygnałem uczącym.

Blokowanie inhibicji w krytycznym oknie

Aby przetestować tę hipotezę, badacze następnie zakłócili zdolność GABA do hamowania komórek w VTA. W jednej grupie szczurów wprowadzili bezpośrednio do tego obszaru lek blokujący receptory GABA typu A podczas pierwszych dwóch sesji karania. W innej grupie zastosowali technikę projektowanych receptorów, aby sztucznie pobudzić neurony dopaminowe podczas tych samych wczesnych sesji. W obu przypadkach natychmiastowy efekt był taki, że szczury nie zmniejszały naciskania karanej dźwigni tak bardzo jak zwierzęta kontrolne i otrzymywały więcej wstrząsów. Co uderzające, gdy to wczesne okno minęło, przywrócenie normalnej chemii mózgu nie naprawiło problemu: nawet w późniejszych dniach bez leku te szczury nadal chętniej naciskały karaną dźwignię i mniej się wahały przed tym.

Trwałe zmiany w wartościowaniu zagrożenia

Kiedy uczenie się kary było już dobrze utrwalone, tymczasowe zablokowanie inhibicji lub pobudzenie komórek dopaminowych nie wywoływało tych samych długotrwałych uszkodzeń. Manipulacje na tym późniejszym etapie mogły przesunąć ogólne poziomy aktywności, na przykład czyniąc zwierzęta bardziej lub mniej ruchliwymi, ale nie wykasowywały wyuczonej tendencji do unikania karanej dźwigni. Dodatkowe testy wykazały, że leczenie nie sprawiało po prostu, że nagrody stają się atrakcyjniejsze w całym spektrum; poszukiwanie jedzenia bez kary nie było konsekwentnie zwiększone. Zamiast tego zakłócenie wydawało się specyficznie interferować z tym, jak mózg powiązał konkretne działanie z jego bolesnym skutkiem podczas pierwszego zetknięcia, pozostawiając zwierzętom długotrwałą „ślepą plamę” względem tego zagrożenia.

Co to znaczy dla ryzykownych wyborów w świecie rzeczywistym

Dla czytelnika popularnonaukowego wniosek jest taki: istnieje krótkie, lecz silne okno uczenia się, tuż gdy po raz pierwszy doświadczamy, że wybór ma szkodliwe konsekwencje, podczas którego precyzyjna inhibicja w ośrodku nagrody uczy nas odpuścić. Jeśli ten sygnał hamujący jest osłabiony, a aktywność dopaminy pozostaje wysoka, mózg może nie zarejestrować prawidłowo niebezpieczeństwa, co prowadzi do trwałej skłonności do powtarzania ryzykownej decyzji nawet gdy przynosi ona ból. Ponieważ wiele substancji uzależniających zwiększa dopaminę lub zmniejsza jej inhibicję, wyniki te sugerują jeden ze sposobów, w jaki takie środki mogą „przewiercać” mózg w kierunku utrwalonych, niewrażliwych na karę nawyków — i sugerują, że ochrona lub przywrócenie tego wczesnego sygnału uczącego może być kluczowe, by pomóc ludziom na nowo nauczyć się unikać szkodliwych zachowań.

Cytowanie: Tan, S.Y.S., Shen, M.H., Keevers, L.J. et al. Disinhibition of ventral tegmental area during initial punishment learning causes enduring punishment insensitivity. Neuropsychopharmacol. 51, 1045–1055 (2026). https://doi.org/10.1038/s41386-026-02368-4

Słowa kluczowe: dopamina, uczenie się związane z karą, okolica brzuszna nakrywki, uzależnienie, podejmowanie ryzyka