Clear Sky Science · nl

Gevectoriseerde instructieve signalen in corticale dendrieten

· Terug naar het overzicht

Hoe hersenen leren van hun eigen neuronen

Moderne kunstmatige-intelligentieprogramma's leren door miljoenen kleine verbindingen nauwkeurig aan te passen, zodat elke neuron in het netwerk zijn eigen leersignaal krijgt. Neurowetenschappers hebben zich lang afgevraagd of het biologische brein een vergelijkbare manier heeft om individuele neuronen te vertellen hoe ze moeten veranderen tijdens leren. Deze studie toont aan dat het antwoord ja is: muizen lijken speciale signalen in de dunne takken van hun hersencellen te gebruiken om leren te sturen, wat een biologische tegenhanger biedt van kernideeën uit machine learning.

Figure 1
Figuur 1.

Gedachte omzetten in een bewegend beeld

Om het leerproces zichtbaar te maken, bouwden de onderzoekers een brein–computerinterface voor muizen. Terwijl een muis op een klein loopbandje rende, keek een microscoop in een deel van zijn hersenen dat betrokken is bij navigatie en geheugen. De wetenschappers kozen twee kleine groepen neuronen in dit gebied en koppelden hun activiteit aan een schuivend gestreept patroon op een scherm. Wanneer de ene groep neuronen actiever werd dan de andere, draaide het patroon naar een specifieke “doel”oriëntatie en kreeg de muis een zoete beloning. Op deze manier definieerden de experimentatoren een precieze regel die de activiteit van elk neuron koppelde aan succes of falen.

Twee populaties, tegengestelde taken

De twee neuronengroepen waren door elkaar heen gelegen in hetzelfde stukje cortex, maar ze hadden tegengestelde effecten op de stimulus: de ene duwde het patroon naar de belonende hoek, de andere duwde het ervan weg. In ongeveer twee weken training leerden de muizen meer beloningen per minuut te verdienen en in een hoger aandeel van de proeven te slagen. Tegelijkertijd bleven de “hulpvaardige” neuronen vaak sterk vuren, terwijl de “niet-helpende” neuronen geleidelijk minder gingen vuren. Deze verschuiving weerspiegelde niet eenvoudigweg een globale verandering in opgewondenheid of loopsnelheid; in plaats daarvan kwam het overeen met hoe de activiteit van elk neuron de prestaties beïnvloedde, wat suggereert dat het brein een fijnmazig credit-assignmentprobleem oploste.

Luisteren naar de verborgen uiteinden van neuronen

Cruciaal was dat het team niet alleen keek naar de cellichamen van deze neuronen, maar ook naar hun lange, boomachtige takken die apicale dendrieten worden genoemd. Deze takken liggen dichter bij het oppervlak van de hersenen en ontvangen andere inputs dan het cellichaam. Door snel te wisselen tussen diepe en oppervlakkige beeldvlakken registreerden de onderzoekers activiteit op beide locaties in dezelfde neuron. Ze vonden dat wanneer een neuron vurde, de sterkte van het signaal in zijn dendrieten groter of kleiner kon zijn dan verwacht op basis van het signaal in het soma, en dat deze afwijkingen deels te voorspellen waren uit het activiteitspatroon van nabijgelegen neuronen. Dit betekent dat de dendrieten niet slechts passief het soma echoën; ze ontvingen verschillende informatie uit het omringende netwerk.

Figure 2
Figuur 2.

Dendrieten dragen beloning- en fouten-signalen

De volgende vraag was wat die dendritische signalen betekenden. Door de timing van gebeurtenissen te analyseren ten opzichte van de beloningsafgifte en de uitkomst van proeven, toonden de auteurs aan dat patronen van dendritische versterking over veel neuronen gebruikt konden worden om beloonde van niet-beloonde proeven en succesvolle van onsuccesvolle pogingen te onderscheiden, zelfs voordat de uitkomst optrad. Met andere woorden: de dendritische signalen droegen informatie over zowel beloning als lopende taalfout die in principe als leersignalen konden dienen. Opmerkelijk genoeg hing het teken van deze signalen af van de causale rol van het neuron: dendrieten van neuronen die hielpen de fout te verkleinen werden versterkt wanneer de fout afnam, terwijl dendrieten van neuronen die het patroon de verkeerde kant op duwden werden versterkt wanneer de fout toenam. Dit “gevectoriseerde” patroon weerspiegelt hoe kunstmatige netwerken verschillende foutboodschappen naar verschillende eenheden sturen.

Het onderwijskanaal afsluiten

Om te testen of deze dendritische patronen van belang waren voor leren, gebruikten de onderzoekers lichtgevoelige eiwitten om een specifieke klasse remmende cellen te activeren die in de buitenste laag van de cortex zitten en apicale dendrieten als doel hebben. Het inschakelen van deze remmende cellen verzwakte de dendritische afwijkingen ten opzichte van somatische activiteit sterk. Onder deze omstandigheden signaliseerde de populatie dendrieten niet langer betrouwbaar beloning of proefoverkomst, en de muizen slaagden er niet in zich te verbeteren in de brein–computer-taak, hoewel de basisopzet ongewijzigd bleef. Vergelijkbare effecten traden op onder anesthesie, wanneer top-down inputs bekendlich gedempt zijn, wat de gedachte ondersteunt dat deze dendritische signalen afhangen van gespecialiseerde feedbackpaden.

Wat dit betekent voor het begrip van leren

Gezamenlijk suggereren de bevindingen dat het brein aparte elektrische compartimenten binnen enkele neuronen gebruikt om leersignalen te routeren, vergelijkbaar met hoe kunstmatige netwerken fouten signaleren naar specifieke eenheden. De apicale dendrieten van corticale neuronen lijken neuron-specifieke informatie te dragen over veranderingen in beloning en fout, en het verstoren van dit kanaal blokkeert leren. Voor niet-specialisten is de kernboodschap dat leren in het brein mogelijk niet alleen afhangt van welke neuronen actief zijn, maar van hoe hun verborgen takken feedback uit de rest van het netwerk integreren — en daarmee een biologische blauwdruk leveren voor enkele kernideeën achter moderne machine learning.

Bronvermelding: Francioni, V., Tang, V.D., Toloza, E.H.S. et al. Vectorized instructive signals in cortical dendrites. Nature 652, 1254–1263 (2026). https://doi.org/10.1038/s41586-026-10190-7

Trefwoorden: dendritische berekening, credit assignment, brein–computerinterface, corticaal leren, neurofeedback