Clear Sky Science · nl

Ontremming van de ventrale tegmentale gebied tijdens initiële strafleren veroorzaakt blijvende ongevoeligheid voor straf

2026-02-17 · Terug naar het overzicht

Waarom we soms slechte gevolgen negeren

De meesten van ons leren snel te stoppen met gedragingen die pijn of problemen veroorzaken. Toch blijven sommige mensen, en veel dieren, beloningen nastreven zelfs als de kosten hoog zijn, zoals bij verslaving of risicovolle besluitvorming. Deze studie onderzoekt wat er gebeurt in een belangrijk beloningscentrum van de hersenen in de eerste momenten dat we leren dat een handeling pijnlijke gevolgen heeft, en hoe het verstoren van dat proces ons hardnekkig ongevoelig voor straf kan maken, lang nadat het gevaar duidelijk is.

Een hersenknooppunt om beloning tegen schade af te wegen

Diep in de middenhersenen ligt het ventraal tegmentale gebied, een klein gebied waarvan de dopamine-afgevende cellen krachtige ‘leersignalen’ over beloningen uitzenden. Deze neuronen schieten in actie wanneer uitkomsten beter zijn dan verwacht en zwijgen wanneer uitkomsten slechter zijn. Ze worden omringd door remmende cellen die de stof GABA gebruiken om de dopamine-uitstoot kort te onderdrukken. Klassieke theorieën stellen dat deze remming dieren helpt schadelijke handelingen te vermijden. Maar onderzoekers wisten niet precies hoe GABA- en dopaminesignalen in dit gebied zich gedragen tijdens straf, of of de korte stilte van dopaminecellen echt nodig is om te leren gevaren te vermijden.

Strafsignalen in real time volgen

De auteurs trainden ratten om aan twee hendels te trekken voor voedsel. Later veroorzaakten drukken op één hendel ook een milde elektrische schok, waardoor die handeling een bestrafte keuze werd, terwijl de andere hendel veilig bleef. Met vezeloptische meetmiddelen mat het team de activiteit in dopaminecellen en de GABA-input die ze ontvingen terwijl de dieren schokken en beloningen ervoeren en besloten welke hendel ze zouden indrukken. Zowel dopamine-activiteit als GABA-input piekten kort wanneer voedsel of een schok optrad. Dopaminecellen reageerden sterker op voedsel, terwijl de GABA-input vooral sterk was bij schokken tijdens de allereerste strafsessie en daarna afnam met ervaring. Rond handelingen zelf verschoof het activiteitspatroon zodanig dat drukken op de bestrafte hendel een duidelijke dopamineuitbarsting ging oproepen, terwijl de veilige hendel dat niet deed. Deze patronen suggereerden dat een GABA-gedreven remmingspiek precies op het moment dat straf voor het eerst wordt ondervonden een cruciaal leersignaal kan zijn.

Remming blokkeren tijdens een kritisch venster

Om dit te testen, verstoorden de onderzoekers vervolgens het vermogen van GABA om cellen in het ventraal tegmentale gebied te remmen. In één groep ratten brachten ze een geneesmiddel rechtstreeks in dit gebied dat GABA type A-receptoren blokkeerde tijdens de eerste twee strafsessies. In een andere groep gebruikten ze een designer-receptor techniek om dopaminecellen kunstmatig te activeren tijdens diezelfde vroege sessies. In beide gevallen was het directe effect dat ratten het drukken op de bestrafte hendel minder verminderden dan controledieren en daardoor meer schokken kregen. Opvallend was dat, zodra dit vroege venster voorbij was, het herstel van normale hersenchemie het probleem niet oploste: zelfs op latere dagen zonder drugs bleven deze ratten gemakkelijker de bestrafte hendel indrukken en aarzelden ze minder voordat ze dat deden.

Blijvende veranderingen in waardering van gevaar

Wanneer het straffenleren al goed was vastgesteld, veroorzaakte tijdelijk blokkeren van remming of het stimuleren van dopaminecellen niet langer hetzelfde blijvende effect. Manipulaties in dat latere stadium konden wel de algemene activiteitsniveaus verschuiven, bijvoorbeeld door dieren meer of minder actief te maken, maar ze wisten de aangeleerde neiging om de bestrafte hendel te vermijden niet uit te wissen. Extra tests toonden aan dat de behandeling niet eenvoudigweg beloningen aantrekkelijker maakte in het algemeen; het ongestrafte voedselzoeken nam niet consequent toe. In plaats daarvan leek de verstoring specifiek te interfereren met hoe de hersenen een bepaalde handeling koppelden aan diens pijnlijke gevolg tijdens die eerste confrontatie, waardoor de dieren een langdurige blinde vlek voor dat gevaar overhielden.

Wat dit betekent voor risicovolle keuzes in de echte wereld

Voor een breed publiek is de belangrijkste conclusie dat er kennelijk een kort maar krachtig leerraamwerk bestaat, precies wanneer we voor het eerst ervaren dat een keuze schadelijke gevolgen heeft, waarin nauwkeurige remming in een beloningscentrum van de hersenen ons leert afstand te nemen. Als dat remmende signaal afgezwakt is en dopamineactiviteit hoog blijft, kan de hersenen het gevaar mogelijk niet goed registreren, wat leidt tot een blijvende neiging dezelfde risicovolle keuze te blijven maken, zelfs als het pijn doet. Omdat veel verslavende middelen dopamine verhogen of diens remming verminderen, suggereren deze bevindingen één manier waarop zulke stoffen de hersenen kunnen bedradEN richting persistente, strafongevoelige gewoonten — en ze wijzen erop dat het beschermen of herstellen van dit vroege leersignaal cruciaal kan zijn om mensen te helpen schadelijk gedrag opnieuw af te leren.

Bronvermelding: Tan, S.Y.S., Shen, M.H., Keevers, L.J. et al. Disinhibition of ventral tegmental area during initial punishment learning causes enduring punishment insensitivity. Neuropsychopharmacol. 51, 1045–1055 (2026). https://doi.org/10.1038/s41386-026-02368-4

Trefwoorden: dopamine, strafleren, ventraal tegmentaal gebied, verslaving, risicogedrag