Clear Sky Science · pl

Lokalne połączenia boczne wystarczające do odtworzenia korteksopodobnej topograficznej organizacji w głębokich sieciach neuronowych

· Powrót do spisu

Dlaczego mapy podobne do mózgowych mają znaczenie w AI

Nasz mózg układa neurony o podobnej funkcji obok siebie, tworząc uporządkowane mapy dla cech takich jak krawędzie, twarze czy miejsca. Układ ten występuje u wielu gatunków i w różnych obszarach mózgu, choć naukowcy wciąż dyskutują, dlaczego istnieje i jak się formuje. W tym badaniu pytamy, czy prosta zasada okablowania — pozwalanie pobliskim neuronom na wzajemną komunikację — może sprawić, że sztuczne sieci same wytworzą podobne mapy, oraz czy ta organizacja daje komputerom praktyczną przewagę, na przykład lepsze rozpoznawanie w hałaśliwym środowisku.

Figure 1
Figure 1.

Wzory na powierzchni mózgu

U naczelnych kora wzrokowa nie jest zbiorem przypadkowo rozmieszczonych komórek. Zamiast tego układa się jak patchwork, w którym sąsiednie neurony mają tendencję do preferowania podobnych cech obrazu. W wczesnych obszarach występują mapy orientacji linii i koloru; w późniejszych obszarach znajdują się skupiska strojone do twarzy, ciał, scen czy przedmiotów codziennych. Klasyczne teorie sugerują, że taka organizacja ewoluowała, by skrócić i usprawnić okablowanie, ale zwykle zakładają specjalne reguły uczenia lub dodatkowe cele, które trudno uzasadnić biologicznie. Autorzy koncentrują się zamiast tego na bardziej podstawowej cechy anatomicznej powszechnej w korze: krótkich, bocznych połączeniach łączących pobliskie neurony, często silniejszych między komórkami już reagującymi podobnie.

Budowa wirtualnej „powłoki” kory

Badacze zaczynają od standardowego modelu wzrokowego, ResNet18, i reorganizują jego jednostki tak, by każda zajmowała stałą pozycję na dwuwymiarowej „powierzchni korowej”. W obrębie każdej warstwy dodają lokalne połączenia boczne, których siła maleje wraz z odległością, naśladując to, że pobliskie neurony kory wzajemnie silniej na siebie wpływają niż odległe. Te boczne łącza nie są trenowane metodą spadku gradientu; trenowane są jedynie zwykłe wagi przepływu w przód. Model uczy się wtedy pojedynczego zadania — rozpoznawania obiektów na dużym zbiorze obrazów — przy użyciu standardowej wstecznej propagacji, bez dodatkowego składnika nagradzającego bezpośrednio gładkie mapy czy krótkie okablowanie.

Mapy podobne do mózgu — od krawędzi po twarze

Nawet przy tym prostym ustawieniu pojawia się bogata topografia. W wczesnych warstwach jednostki tworzą gładkie mapy orientacji, częstości przestrzennej i koloru przypominające te rejestrowane w pierwotnej korze wzrokowej. Jednostki sąsiadujące reagują bardziej podobnie niż odległe, a kierunki zmian orientacji i częstości przestrzennej mają tendencję do krzyżowania się pod kątem prostym, co odbija drobne obserwacje z badań na zwierzętach. Gdy pierwsza warstwa zostanie uczyniona bardziej biologicznie szczegółową przez usunięcie współdzielenia wag, model odtwarza też charakterystyczne cechy, takie jak wzory pinwheel w mapach orientacji. W głębszych warstwach pojawiają się skupiska strojone do kategorii takich jak twarze, ciała i sceny, rozciągające się w pasmach po symulowanej powierzchni, co ściśle naśladuje znane układy w ludzkiej brzuszno‑skroniowej korze wzrokowej. Model odtwarza nawet szersze podziały, na przykład oddzielne strumienie dla obiektów ożywionych kontra nieożywionych oraz dla małych kontra dużych obiektów w rzeczywistym świecie.

Figure 2
Figure 2.

Niewidoczne obszary mózgu i ekonomia okablowania

Badanie sięga dalej niż znane gorące punkty, badając rejony o mniej określonej funkcji. Korzystając z obrazowania mózgu o wysokiej rozdzielczości, autorzy identyfikują pośrednią łatkę kory ludzkiej położoną między obszarami wybiórczymi dla twarzy i miejsc. W ich modelu jednostki, których aktywność najlepiej odpowiada tej łatce, znajdują się na pozycjach pośrednich między odpowiadającymi skupiskami wybiórczymi dla twarzy i scen, co sugeruje, że sztuczna topografia uogólnia się na nieznane terytoria. Szacują też efektywną długość połączeń między silnie aktywnymi jednostkami w różnych warstwach. Ku zaskoczeniu, sieci z połączeniami bocznymi kończą z dużo krótszą ogólną długością połączeń niż zarówno pierwotna sieć nietopograficzna, jak i wcześniejszy model optymalizowany wprost pod minimalizację okablowania, co sugeruje, że realistyczne uczenie może samo faworyzować ekonomiczne układy, gdy architektura zawiera lokalną strukturę boczną.

Odporne widzenie dzięki lokalnej współpracy

Jednym z najbardziej intrygujących wyników jest funkcjonalny efekt: skupione mapy utrudniają oszukanie modelu. Kiedy obrazy są celowo zakłócane przez silne ataki adwersarialne — drobne zmiany pikseli mające na celu zwieść klasyfikator — sieci z lokalnymi połączeniami bocznymi utrzymują wyższą dokładność niż model bazowy, szczególnie gdy połączenia boczne obejmują większe sąsiedztwo. Autorzy interpretują skupiska jako zespoły podobnych jednostek, które uśredniają szum, podobnie jak metody zespołowe w uczeniu maszynowym. To sugeruje, że topografia może być czymś więcej niż oszczędnym okablowaniem: może też wspierać stabilne, niezawodne postrzeganie przez pozwalanie grupom pobliskich neuronów na współpracę.

Co to znaczy dla mózgów i maszyn

Praca pokazuje, że samo dodanie realistycznych lokalnych połączeń bocznych do głębokiej sieci wystarcza, by wytworzyć korteks‑podobne mapy na wielu skalach, bez specjalnych reguł uczenia, które neurony miałyby trudność wdrożyć. Jednocześnie taka organizacja poprawia odporność i zmniejsza całkowite okablowanie, sugerując, że ewolucja mogła faworyzować topografię zarówno ze względu na efektywność, jak i niezawodne wykrywanie. Dla neurobiologii model oferuje zunifikowany przepis obwodowy, który może wyjaśnić różnorodne mapy wzrokowe; dla sztucznej inteligencji wskazuje kierunek ku architekturom, które są nie tylko bardziej podobne do mózgu, ale też bardziej odporne na hałas i ataki adwersarialne.

Cytowanie: Qian, X., Dehghani, A.O., Farahani, A.B. et al. Local lateral connectivity is sufficient for replicating cortex-like topographical organization in deep neural networks. Nat Commun 17, 4042 (2026). https://doi.org/10.1038/s41467-026-70065-3

Słowa kluczowe: topografia korowa, połączenia boczne, głębokie sieci neuronowe, kora wzrokowa, odporność na ataki