Clear Sky Science · pl
Wektorowe sygnały dydaktyczne w dendrytach kory
Jak mózgi uczą się od własnych neuronów
Nowoczesne programy sztucznej inteligencji uczą się poprzez precyzyjne dostosowywanie milionów drobnych połączeń, tak aby każdy neuron w sieci otrzymał własny sygnał uczący. Neurobiolodzy od dawna zastanawiali się, czy mózg biologiczny ma porównywalny sposób informowania poszczególnych neuronów, jak mają się zmieniać podczas uczenia. To badanie pokazuje, że odpowiedź brzmi tak: myszy wydają się używać specjalnych sygnałów w cienkich gałęziach swoich komórek nerwowych do kierowania procesem uczenia, oferując biologiczny odpowiednik kluczowych idei z uczenia maszynowego.

Przemiana myśli w ruchomy obraz
Aby uczynić proces uczenia widocznym, badacze zbudowali interfejs mózg–komputer dla myszy. Gdy mysz biegała na małej bieżni, mikroskop przyglądał się części jej mózgu zaangażowanej w nawigację i pamięć. Naukowcy wybrali dwie niewielkie grupy neuronów w tym obszarze i powiązali ich aktywność z przesuwającym się wzorem prążków na ekranie. Gdy jedna grupa neuronów była bardziej aktywna niż druga, wzór obracał się w kierunku określonej „docelowej” orientacji, a mysz otrzymywała słodką nagrodę. W ten sposób eksperymentatorzy zdefiniowali precyzyjną regułę łączącą aktywność każdego neuronu z sukcesem lub porażką.
Dwie populacje, przeciwne role
Obie grupy neuronów były wymieszane w tej samej płatowej części kory, ale miały przeciwne efekty na bodziec: jedna popychała wzór w stronę nagradzającego kąta, druga odpychała go od niego. W ciągu około dwóch tygodni treningu myszy nauczyły się zdobywać więcej nagród na minutę i odnosić sukces w większym odsetku prób. Jednocześnie „pomocne” neurony miały tendencję do utrzymywania wysokiej aktywności, podczas gdy „niepomocne” stopniowo zmniejszały swoją aktywność. Ta zmiana nie odzwierciedlała po prostu globalnej zmiany pobudzenia czy prędkości biegu; zamiast tego odpowiadała temu, jak aktywność każdego neuronu wpływała na wykonanie zadania, sugerując, że mózg rozwiązywał drobnoziarnisty problem przypisywania zasługi.
Słuchając ukrytych zakończeń neuronów
Co istotne, zespół obserwował nie tylko ciała komórkowe tych neuronów, lecz także ich długie, drzewiaste gałęzie zwane dendrytami apikalnymi. Te gałęzie leżą bliżej powierzchni mózgu i otrzymują inne sygnały wejściowe niż soma. Poprzez szybkie przełączanie ogniskowania między głębokimi i powierzchniowymi płaszczyznami obrazowania badacze zarejestrowali aktywność z obu miejsc w tym samym neuronie. Stwierdzili, że gdy neuron wystrzeliwał, siła sygnału w jego dendrytach mogła być większa lub mniejsza niż oczekiwano na podstawie sygnału w somie, a te niedopasowania były częściowo przewidywalne na podstawie wzorca aktywności pobliskich neuronów. Oznacza to, że dendryty nie tylko biernie powtarzały aktywność somy; odbierały odrębne informacje z otaczającej sieci.

Dendryty niosą sygnały nagrody i błędu
Następne pytanie brzmiało, co te dendrytyczne sygnały oznaczają. Analizując czas wystąpienia zdarzeń względem dostarczenia nagrody i wyniku próby, autorzy pokazali, że wzory wzmocnienia dendrytów w wielu neuronach można było wykorzystać do odróżnienia prób nagrodzonych od nienagrodzonych oraz udanych od nieudanych, nawet zanim wynik stał się oczywisty. Innymi słowy, sygnały dendrytów niosły informacje zarówno o nagrodzie, jak i o bieżącym błędzie zadania, które mogłyby, w teorii, służyć jako sygnały uczące. Co uderzające, znak tych sygnałów zależał od przyczynowej roli neuronu: dendryty neuronów, które pomagały zmniejszać błąd, były wzmacniane, gdy błąd malał, podczas gdy dendryty neuronów, które popychały wzór w niewłaściwym kierunku, były wzmacniane, gdy błąd wzrastał. Ten „wektoryzowany” wzór odzwierciedla sposób, w jaki sieci sztuczne wysyłają różne komunikaty o błędzie do różnych jednostek.
Wyłączanie kanału nauczania
Aby sprawdzić, czy te dendrytyczne wzory mają znaczenie dla uczenia się, badacze użyli białek wrażliwych na światło do aktywacji konkretnej klasy komórek hamujących, które leżą w najbardziej zewnętrznej warstwie kory i celują w dendryty apikalne. Włączenie tych komórek hamujących silnie osłabiło niedopasowania dendrytów względem aktywności somy. W takich warunkach populacja dendrytów przestała wiarygodnie sygnalizować nagrodę lub wynik próby, a myszy nie poprawiały wyników w zadaniu mózg–komputer, mimo że podstawowy układ eksperymentalny pozostał niezmieniony. Podobne efekty obserwowano pod narkozą, kiedy znane jest osłabienie wejść od góry do dołu, co dodatkowo wspiera tezę, że te dendrytyczne sygnały zależą od wyspecjalizowanych szlaków sprzężenia zwrotnego.
Co to oznacza dla rozumienia uczenia
Podsumowując, wyniki sugerują, że mózg używa odrębnych elektrycznych przedziałów wewnątrz pojedynczych neuronów do kierowania sygnałów uczących, podobnie jak sieci sztuczne kierują sygnały błędu do konkretnych jednostek. Dendryty apikalne neuronów kory wydają się przenosić specyficzne dla neuronu informacje o nagrodzie i zmianach błędu, a zakłócenie tego kanału blokuje uczenie. Dla osoby niezaznajomionej z tematem kluczowym przesłaniem jest to, że uczenie w mózgu może zależeć nie tylko od tego, które neurony są aktywne, lecz od tego, jak ich ukryte gałęzie integrują sprzężenie zwrotne z reszty sieci — dostarczając biologiczny plan dla niektórych podstawowych idei stojących za współczesnym uczeniem maszynowym.
Cytowanie: Francioni, V., Tang, V.D., Toloza, E.H.S. et al. Vectorized instructive signals in cortical dendrites. Nature 652, 1254–1263 (2026). https://doi.org/10.1038/s41586-026-10190-7
Słowa kluczowe: obliczenia dendrytyczne, przypisywanie zasługi, interfejs mózg–komputer, uczenie kory, neurofeedback