Clear Sky Science · es

Señales instructivas vectorizadas en las dendritas corticales

· Volver al índice

Cómo los cerebros aprenden de sus propias neuronas

Los programas de inteligencia artificial modernos aprenden ajustando cuidadosamente millones de pequeñas conexiones para que cada neurona en la red reciba su propia señal de enseñanza. Los neurocientíficos se han preguntado durante mucho tiempo si el cerebro biológico tiene una forma comparable de decirle a las neuronas individuales cómo cambiar durante el aprendizaje. Este estudio muestra que la respuesta es sí: en ratones parecen usarse señales especiales en las ramas delgadas de sus células cerebrales para guiar el aprendizaje, ofreciendo un homólogo biológico a ideas centrales del aprendizaje automático.

Figure 1
Figura 1.

Convertir el pensamiento en una imagen en movimiento

Para hacer visible el proceso de aprendizaje, los investigadores construyeron una interfaz cerebro–ordenador para ratones. Mientras un ratón corría en una pequeña cinta, un microscopio observaba una parte de su cerebro implicada en la navegación y la memoria. Los científicos eligieron dos pequeños grupos de neuronas en esta región y vincularon su actividad a un patrón de franjas que se desplazaba en una pantalla. Cuando un grupo de neuronas se volvía más activo que el otro, el patrón rotaba hacia una orientación «objetivo» específica, y el ratón recibía una recompensa dulce. De este modo, los experimentadores definieron una regla precisa que ataba la actividad de cada neurona al éxito o al fracaso.

Dos poblaciones, funciones opuestas

Los dos grupos neuronales estaban entremezclados en el mismo parche de corteza, pero tenían efectos opuestos sobre el estímulo: uno empujaba el patrón hacia el ángulo recompensado y el otro lo alejaba. A lo largo de unas dos semanas de entrenamiento, los ratones aprendieron a obtener más recompensas por minuto y a tener éxito en una fracción mayor de ensayos. Al mismo tiempo, las neuronas «útiles» tendieron a seguir disparando con fuerza, mientras que las «no útiles» disparaban cada vez menos. Este cambio no reflejó simplemente una modificación global de la excitación o de la velocidad de carrera; en cambio, coincidió con la forma en que la actividad de cada neurona influía en el rendimiento de la tarea, sugiriendo que el cerebro resolvía un problema fino de asignación de crédito.

Escuchando los extremos ocultos de las neuronas

De forma crucial, el equipo observó no solo los cuerpos principales de estas neuronas sino también sus largas ramas en forma de árbol llamadas dendritas apicales. Estas ramas se sitúan más cerca de la superficie cerebral y reciben entradas distintas a las que llegan al soma. Cambiando rápidamente el enfoque entre planos de imagen profundos y superficiales, los investigadores registraron actividad en ambos sitios de la misma neurona. Encontraron que cuando una neurona disparaba, la intensidad de la señal en sus dendritas podía ser mayor o menor de lo esperado a partir de la señal en el soma, y que estas discrepancias eran en parte previsibles a partir del patrón de actividad de neuronas cercanas. Esto significa que las dendritas no estaban simplemente haciendo eco pasivo del soma; recibían información distinta de la red circundante.

Figure 2
Figura 2.

Las dendritas llevan señales de recompensa y error

La pregunta siguiente fue qué significaban esas señales dendríticas. Analizando la sincronía de los eventos en relación con la entrega de la recompensa y el resultado del ensayo, los autores mostraron que los patrones de amplificación dendrítica a través de muchas neuronas podían usarse para distinguir ensayos recompensados de no recompensados y intentos exitosos de no exitosos, incluso antes de que se conociera el resultado. En otras palabras, las señales dendríticas transportaban información tanto sobre la recompensa como sobre el error en curso de la tarea que, en principio, podría servir como señal de enseñanza. De forma llamativa, el signo de estas señales dependía del papel causal de la neurona: las dendritas de las neuronas que ayudaban a reducir el error se amplificaban cuando el error disminuía, mientras que las dendritas de las neuronas que empujaban el patrón en la dirección equivocada se amplificaban cuando el error aumentaba. Este patrón «vectorizado» refleja cómo las redes artificiales envían distintos mensajes de error a distintas unidades.

Cerrar el canal de enseñanza

Para comprobar si estos patrones dendríticos importaban para el aprendizaje, los investigadores usaron proteínas sensibles a la luz para activar una clase específica de células inhibitorias que se sitúan en la capa más externa de la corteza y se dirigen a las dendritas apicales. Encender estas células inhibitorias debilitó mucho las discrepancias dendríticas respecto a la actividad somática. En esas condiciones, la población de dendritas dejó de señalar de forma fiable la recompensa o el resultado del ensayo, y los ratones no mejoraron en la tarea cerebro–ordenador, aunque el montaje básico no se había cambiado. Efectos similares ocurrieron bajo anestesia, cuando se sabe que las entradas de arriba hacia abajo están atenuadas, lo que refuerza la idea de que estas señales dendríticas dependen de vías de retroalimentación especializadas.

Qué implica esto para entender el aprendizaje

En conjunto, los hallazgos sugieren que el cerebro utiliza compartimentos eléctricos separados dentro de una sola neurona para encaminar señales de enseñanza, de forma análoga a cómo las redes artificiales dirigen señales de error a unidades particulares. Las dendritas apicales de las neuronas corticales parecen llevar información específica por neurona sobre cambios en la recompensa y el error, y interferir con este canal bloquea el aprendizaje. Para un público no especializado, el mensaje clave es que el aprendizaje en el cerebro puede depender no solo de qué neuronas están activas, sino de cómo sus ramas ocultas integran la retroalimentación del resto de la red —proporcionando un plano biológico para algunas de las ideas centrales detrás del aprendizaje automático moderno.

Cita: Francioni, V., Tang, V.D., Toloza, E.H.S. et al. Vectorized instructive signals in cortical dendrites. Nature 652, 1254–1263 (2026). https://doi.org/10.1038/s41586-026-10190-7

Palabras clave: cálculo dendrítico, asignación de crédito, interfaz cerebro–ordenador, aprendizaje cortical, neurofeedback