Clear Sky Science · de

Modellierung von Aufmerksamkeit und Bindung im Gehirn durch bidirektionales rekurrentes Gating

· Zurück zur Übersicht

Wie das Gehirn weiß, worauf es achten soll

In jedem Augenblick bombardieren Ihre Augen das Gehirn mit weit mehr Informationen, als Sie bewusst wahrnehmen könnten. Trotzdem können Sie mühelos einen Freund in einer Menschenmenge ausmachen, einem fahrenden Auto folgen oder Ihren Schlüssel auf einem überfüllten Tisch suchen. Diese Fähigkeit, sich auf Wichtiges zu konzentrieren, die richtigen Merkmale zusammenzuführen und Ablenkungen zu ignorieren, nennt man Aufmerksamkeit. Der hier beschriebene Artikel stellt ein neues, am Gehirn orientiertes Computermodell vor, das erklären soll, wie eine so große Vielfalt an aufmerksamkeitstypischen Leistungen aus einem einzigen zugrundeliegenden Mechanismus entstehen könnte.

Figure 1
Figure 1.

Ein Modell für viele Arten von Fokus

Aufmerksamkeit ist nicht nur eine einzige Sache. Manchmal richten wir uns auf einen Ort im Raum, wie mit einem Scheinwerfer. Manchmal schärfen wir auf ein Merkmal, etwa eine bestimmte Farbe, und manchmal fixieren wir ganze Objekte, sodass deren Teile zusammenbleiben, selbst wenn sie sich bewegen oder teilweise verdeckt sind. Die Autorinnen und Autoren argumentieren, dass statt separater, zweckgebundener Systeme all diese Formen der Aufmerksamkeit aus einem gemeinsamen Schaltkreismuster im visuellen Pfad des Gehirns entstehen könnten. Sie bauen ein Modell nach, das den ventralen visuellen Strom nachahmt — die Reihe von Hirnregionen, die rohe Pixel auf der Netzhaut in erkennbare Objekte verwandelt. In ihrem Entwurf bewegt ein Pfad Informationen nach oben und extrahiert visuelle Merkmale, während ein anderer Pfad Signale zurück nach unten sendet und entscheidet, welche Merkmale verstärkt oder abgeschwächt werden sollen.

Tore, die in beide Richtungen kommunizieren

Im Zentrum des Modells steht etwas, das die Autorinnen und Autoren bidirektionales rekurrentes Gating nennen. Stellen Sie sich einen Stapel visueller Verarbeitungsstufen vor, von einfachen Kanten bis zu komplexen Formen. Auf jeder Stufe trägt das vorwärts laufende Signal, was im Bild ist, während ein rückwärts und seitwärts laufendes Signal transportiert, was für die aktuelle Aufgabe relevant ist. Diese Signale treffen an „Gates“ zusammen, die die Aktivität von Merkmalen über mehrere Zeitschritte multiplizierend hoch- oder herunterregeln. Da die Verbindungen rekurrent sind, kann das Modell seinen Fokus im Laufe der Zeit verfeinern — ähnlich wie Sie, wenn Sie eine unordentliche Szene nur flüchtig erfassen und dann allmählich ein Ziel ins Auge fassen. Diese Architektur wird mit üblichen Methoden des maschinellen Lernens auf zwei grundlegende Ziele trainiert — zu klassifizieren, was vorhanden ist, und zu segmentieren, wo es ist — ohne dass ihr explizit gesagt wird, wie sie Aufmerksamkeit umzusetzen hat.

Lernen zu suchen, zu verfolgen und Ablenkungen zu ignorieren

Nach dem Training wird das Modell an einer Reihe klassischer Aufmerksamkeitsaufgaben getestet, die normalerweise Menschen und Tieren gestellt werden. Mit Bildern aus handschriftlichen Ziffern und natürlichen Fotografien von Tieren lernt es, Objekte in Unordnung zu erkennen, Elemente zu gruppieren, die hingegeben werden, sich bewegende Objekte zu verfolgen und visuelle Suche basierend auf visuellen Hinweisen oder symbolischen Signalen wie Pfeilen durchzuführen. Es kann ein einzelnes abweichendes Element in einer Matrix hervorheben, die Aufmerksamkeit von einem Objekt zum nächsten wechseln, ohne „hängen zu bleiben“, und ein Ziel über die Zeit verfolgen, während es Ablenkungen ausblendet. Bemerkenswerterweise treten viele dieser Verhaltensweisen bereits dann auf, wenn das Modell nur Rückmeldung über die finale Antwort erhält, nicht darüber, wohin es hätte schauen sollen — was nahelegt, dass aufmerksamkeitliche Strategien als Nebeneffekt des Lernens zur Lösung relevanter Aufgaben entstehen können.

Spiegelung menschlicher Wahrnehmung und Hirnsignale

Die Autorinnen und Autoren fragen dann, ob sich das Modell in subtileren Aspekten wie Menschen verhält. In kontrollierten Tests mit einfachen Musterpatches zeigt das Modell verbesserte Sensitivität, wenn ein Hinweis auf den korrekten Ort zeigt, und seine Leistung verschlechtert sich, wenn viele Ablenkungen vorhanden sind — eine Parallele zu menschlichen Befunden zu Kontrastempfindlichkeit und Wahrnehmungsbelastung. Es „fällt“ auch auf eine klassische Wahrnehmungsillusion herein, bei der ein sichtbarer Okkluder eine fragmentierte Form leichter erkennbar macht, was darauf hindeutet, dass es Figur und Hintergrund auf eine gehirnähnliche Weise repräsentiert. Ein Blick ins Netzwerk zeigt, dass Einheiten in tieferen Schichten Antwortverstärkungen zeigen, wenn ihr bevorzugtes Objekt beachtet wird, ohne ihre grundlegende Abstimmung zu ändern — ähnlich wie Neurone im visuellen Kortex von Primaten. Unterschiedliche Gruppen von Einheiten verhalten sich wie Merkmalsdetektoren und „Border‑Ownership“-Zellen, die helfen zu entscheiden, welche Seite einer Kante zur Figur und welche zum Hintergrund gehört.

Figure 2
Figure 2.

Warum das für Gehirne und Maschinen wichtig ist

Die Arbeit legt nahe, dass viele kennzeichnende Merkmale biologischer Aufmerksamkeit — Ausrichten auf Hinweise, Herausfiltern irrelevanter Unordnung, Suche nach Zielen, Zusammenführen von Merkmalen zu kohärenten Objekten und sogar einige Versäumnisse des Bewusstseins — alle aus einem einzigen architektonischen Prinzip entstehen können: rekurrentes Gating zwischen einem Merkmalsweg und einem Aufmerksamkeitsweg. Einfach ausgedrückt zeigt das Modell, wie ein System, das wiederholt das Gewicht dessen, was es sieht, basierend auf aktuellen Zielen und Kontext neu setzt, lernen kann, „Aufmerksamkeit zu schenken“, ohne dafür explizit programmiert worden zu sein. Das bietet Neurowissenschaftlerinnen und Neurowissenschaftlern ein konkretes, testbares Rahmenmodell zur Erklärung von Aufmerksamkeit und Bindung im Gehirn und gibt KI‑Forscherinnen und -Forschern eine biologisch inspirierte Alternative zu den heute vorherrschenden weitgehend feedforward orientierten Entwürfen.

Zitation: Salehi, S., Lei, J., Benjamin, A.S. et al. Modeling attention and binding in the brain through bidirectional recurrent gating. Nat Commun 17, 4072 (2026). https://doi.org/10.1038/s41467-026-72146-9

Schlüsselwörter: visuelle Aufmerksamkeit, Merkmalsbindung, rekurrente neuronale Netze, computationale Neurowissenschaft, hirn‑inspiriertes KI