Clear Sky Science · es

Desinhibición del área tegmental ventral durante el aprendizaje inicial del castigo provoca insensibilidad al castigo de larga duración

2026-02-17 · Volver al índice

Por qué a veces ignoramos las malas consecuencias

La mayoría aprendemos rápidamente a dejar de hacer cosas que nos causan dolor o problemas. Sin embargo, algunas personas, y muchos animales, siguen persiguiendo recompensas aun cuando el coste es alto, como ocurre en la adicción o en la toma de decisiones arriesgadas. Este estudio pregunta qué sucede dentro de un centro clave de recompensa del cerebro en los primeros momentos en que aprendemos que una acción tiene consecuencias dolorosas, y cómo alterar ese proceso puede dejarnos obstinadamente insensibles al castigo mucho después de que el peligro sea evidente.

Un nodo cerebral para sopesar recompensa frente a daño

En lo profundo del mesencéfalo se encuentra el área tegmental ventral, una pequeña región cuyas células liberadoras de dopamina emiten poderosas “señales de enseñanza” sobre las recompensas. Estas neuronas estallan en actividad cuando las cosas resultan mejores de lo esperado y se silencian cuando los resultados son peores. Están rodeadas por células inhibitorias que usan el químico GABA para silenciar brevemente la salida de dopamina. Las teorías clásicas sostienen que esta inhibición ayuda a los animales a aprender a evitar acciones dañinas. Pero los investigadores no sabían exactamente cómo se comportan las señales de GABA y dopamina en esta región durante el castigo, ni si el breve silenciamiento de las células dopaminérgicas es realmente necesario para aprender a alejarse del peligro.

Observando las señales de castigo en tiempo real

Los autores entrenaron ratas para presionar dos palancas por comida. Más tarde, las pulsaciones en una palanca también desencadenaban una ligera descarga eléctrica, convirtiendo esa acción en una elección castigada, mientras que la otra palanca permanecía segura. Usando herramientas de registro por fibra óptica, el equipo midió la actividad en las células de dopamina y la entrada de GABA que recibían mientras los animales experimentaban descargas y recompensas y decidían qué palanca presionar. Tanto la actividad dopaminérgica como la entrada de GABA se dispararon brevemente cuando ocurría comida o una descarga. Las células de dopamina respondieron con más fuerza a la comida, mientras que la entrada de GABA fue especialmente intensa ante las descargas durante la primera sesión de castigo y luego se fue atenuando con la experiencia. En torno a las propias acciones, los patrones de actividad cambiaron de modo que las pulsaciones en la palanca castigada llegaron a evocar un estallido distinto de actividad dopaminérgica, mientras que la palanca segura no lo hacía. Estos patrones sugerían que un auge de inhibición impulsada por GABA justo cuando se encuentra el castigo por primera vez podría ser una señal de enseñanza crucial.

Bloquear la inhibición durante una ventana crítica

Para poner a prueba esta idea, los investigadores interfirieron a continuación con la capacidad del GABA para inhibir células en el área tegmental ventral. En un grupo de ratas infundieron un fármaco directamente en esta región que bloqueaba los receptores GABA tipo A durante las dos primeras sesiones de castigo. En otro grupo, usaron una técnica de receptores diseñados para excitar artificialmente las neuronas dopaminérgicas durante esas mismas sesiones tempranas. En ambos casos, el efecto inmediato fue que las ratas redujeron menos las pulsaciones en la palanca castigada que los animales de control y acabaron recibiendo más descargas. De manera llamativa, una vez pasada esta ventana temprana, restaurar la química cerebral normal no solucionó el problema: incluso en días posteriores sin ningún fármaco, estas ratas continuaron presionando la palanca castigada con más facilidad y vacilaron menos antes de hacerlo.

Cambios duraderos en cómo se valora el peligro

Cuando el aprendizaje por castigo ya estaba bien establecido, bloquear temporalmente la inhibición o excitar las células dopaminérgicas ya no producía el mismo daño duradero. Las manipulaciones en esa etapa tardía podían desplazar los niveles generales de actividad, por ejemplo haciendo a los animales más o menos activos, pero no borraban la tendencia aprendida a evitar la palanca castigada. Pruebas adicionales mostraron que el tratamiento no hacía simplemente que las recompensas fuesen más atractivas en general; la búsqueda de comida no castigada no aumentó de forma consistente. En cambio, la alteración pareció interferir específicamente con la forma en que el cerebro vinculaba una acción concreta con su resultado doloroso durante ese primer encuentro, dejando a los animales con un punto ciego a largo plazo para ese peligro.

Qué significa esto para las decisiones arriesgadas en el mundo real

Para un lector no especializado, la conclusión es que parece existir una ventana de aprendizaje breve pero poderosa, justo cuando por primera vez experimentamos que una elección tiene consecuencias dañinas, durante la cual una inhibición precisa en un centro de recompensa del cerebro nos enseña a apartarnos. Si esa señal inhibitoria se atenúa y la actividad dopaminérgica permanece alta, el cerebro puede no registrar correctamente el peligro, produciendo una tendencia duradera a seguir tomando la elección arriesgada aun cuando resulte perjudicial. Dado que muchas drogas adictivas aumentan la dopamina o reducen su inhibición, estos hallazgos sugieren una vía por la que tales sustancias podrían cablear el cerebro hacia hábitos persistentes e insensibles al castigo—y apuntan a que proteger o restaurar esta señal temprana de enseñanza podría ser clave para ayudar a las personas a reaprender a evitar conductas dañinas.

Cita: Tan, S.Y.S., Shen, M.H., Keevers, L.J. et al. Disinhibition of ventral tegmental area during initial punishment learning causes enduring punishment insensitivity. Neuropsychopharmacol. 51, 1045–1055 (2026). https://doi.org/10.1038/s41386-026-02368-4

Palabras clave: dopamina, aprendizaje por castigo, área tegmental ventral, adicción, toma de riesgos