Clear Sky Science · de

ChatBCI, ein P300-Speller-BCI mit kontextgesteuerter Wortvorhersage unter Nutzung großer Sprachmodelle, vom Konzept bis zur Evaluation

· Zurück zur Übersicht

Gedanken eine Stimme geben

Für Menschen, die nicht sprechen oder sich kaum bewegen können, kann schon das Übermitteln einer einfachen Bitte langsam und anstrengend sein. Diese Studie stellt ChatBCI vor, ein Brain‑Computer‑Interface, das Nutzern erlaubt, Wörter auf einem Bildschirm allein mit ihren Hirnsignalen zu buchstabieren, während ein leistungsfähiges Sprachmodell (ähnlich wie ChatGPT) vorhersagt, was sie als Nächstes sagen möchten. Durch die Kombination von Hirnsignalen mit intelligenter Wortvorhersage zielt das System darauf ab, Kommunikation schneller, weniger ermüdend und näher an alltägliche Gespräche zu bringen.

Figure 1
Figure 1.

Wie das Gehirn mit einem Computer spricht

ChatBCI baut auf einem bekannten Ansatz auf, dem P300‑Speller. In diesem Aufbau blinkt ein Raster aus Buchstaben und Funktionstasten auf einem Bildschirm. Wenn sich ein Nutzer still auf den gewünschten Buchstaben konzentriert, erzeugt das Gehirn ein kurzes, typisches Signal etwa 300 Millisekunden nachdem die entsprechende Zeile oder Spalte aufgeleuchtet hat. Elektroden einer EEG‑Haube zeichnen diese winzigen Spannungsänderungen auf, und Software erkennt, welche Zeile und Spalte die stärkste Reaktion ausgelöst hat, wodurch die gewünschte Taste ermittelt wird. Traditionell müssen Nutzer jeden Buchstaben einzeln auswählen, was zwar genau ist, aber bei längeren Sätzen sehr langsam und mental belastend sein kann.

Hinzu kommt intelligente Wortvorhersage

Die Innovation von ChatBCI besteht darin, ein großes Sprachmodell direkt in diesen Schreibprozess einzubinden. Die Bildschirmtastatur zeigt weiterhin Buchstaben, aber jetzt werden auch zehn Wortvorschläge an den Seiten angezeigt — Kandidaten, die in Echtzeit von einem online laufenden GPT‑3.5‑Modell geliefert werden. Sobald der Nutzer einen Teil eines Wortes oder eines kurzen Satzes buchstabiert hat, wird der partielle Satz als Text an das Sprachmodell gesendet. Ein sorgfältig formuliertes Prompt weist das Modell an, eine kompakte Liste wahrscheinlicher nächster Wörter oder Vervollständigungen zurückzugeben. Das System parst diese Antwort und verwandelt jedes vorgeschlagene Wort in eine auswählbare Taste auf der Tastatur. Das Auswählen eines dieser Vorschläge fügt sofort das ganze Wort (oder sogar eine kurze Wortgruppe) ein und ergänzt ein Leerzeichen, sodass Nutzer Sätze deutlich schneller zusammenstellen können, als wenn sie jeden Buchstaben einzeln wählen müssten.

Figure 2
Figure 2.

ChatBCI auf die Probe gestellt

Sieben Freiwillige testeten ChatBCI in mehreren Phasen. Zuerst wurden ihre individuellen Hirnmuster aufgezeichnet, während sie sich auf bekannte Tasten konzentrierten; so konnte das System einen Klassifikator trainieren, der das P300‑Signal erkennt. Danach absolvierten sie zwei realistische Texteingabeaufgaben. In einer Copy‑Spelling‑Aufgabe wählte jede Person ein Bild aus, erfand einen sinnvollen Satz dazu (etwa eine Bitte um Wasser oder um eine Toilette) und buchstabierte diesen Satz dann auf zwei Arten: einmal mit ChatBCI und Wortvorschlägen und einmal im traditionellen Buchstabe‑für‑Buchstabe‑Modus mit deaktivierten Vorschlägen. In einer zweiten, improvisatorischen Aufgabe sollten sie frei einen eigenen Satz beginnen, ausgehend von einem gewählten Anfangsbuchstaben, und wurden ermuntert, so weit wie möglich auf die vorgeschlagenen Wörter zu vertrauen statt alles von Grund auf zu buchstabieren.

Schnellere Nachrichten, weniger Tastenanschläge

Die Ergebnisse zeigten deutliche Vorteile durch die Kombination von Hirnsignalen und Sprachvorhersage. In der Copy‑Spelling‑Aufgabe reduzierte ChatBCI die durchschnittliche Zeit, einen Satz zu schreiben, von etwa 28 Minuten auf ungefähr 10 Minuten — eine Reduktion um 62 % — und verdoppelte gleichzeitig mehr als die Rate korrekt getippter Zeichen pro Minute. Die Anzahl benötigter Tastenanschläge sank um etwa die Hälfte und die Genauigkeit verbesserte sich: Nutzer erhielten mit ChatBCI fast immer vollständig korrekt geschriebene Sätze. Um zu erfassen, wie viel Arbeit das System spart, verwendeten die Autoren eine Messgröße „keystroke savings“ (Tastaturanschlagsersparnis) und ein neues „keystroke savings deficit ratio“, die die Leistung mit idealisierten Systemen vergleichen, die das richtige Wort immer nach einer oder zwei Aktionen erraten könnten. In der freien Improvisationsaufgabe erreichte ChatBCI im Mittel etwa 81 % Tastaturanschlagsersparnis und übertraf manchmal sogar theoretische Grenzen, weil das Sprachmodell gelegentlich mehrwortige Phrasen vorschlug, die mit einer einzigen Auswahl eingefügt werden konnten.

Was das für die Kommunikation im Alltag bedeutet

Für Alltagsnutzer — insbesondere solche mit schweren Bewegungs‑ oder Sprachbeeinträchtigungen — ist das Ergebnis einfach: ChatBCI ermöglicht es Menschen, mehr mit weniger mentalem Aufwand und in deutlich kürzerer Zeit zu sagen. Indem die Sprachvorhersage an ein entferntes großes Sprachmodell ausgelagert wird, vermeidet das System die Notwendigkeit lokaler Trainings oder umfangreicher Wortlisten und passt sich dennoch dem Satz an, den der Nutzer formulieren möchte. Obwohl weitere Untersuchungen in klinischen Populationen sowie Maßnahmen zur Adressierung von Privatsphäre, Kosten und Zuverlässigkeit cloudbasierter Sprachmodelle nötig sind, zeigt diese Studie, dass die Kombination von Hirnschnittstellen mit moderner Sprachtechnologie langsames Buchstabe‑für‑Buchstabe‑Buchstabieren in ein natürlicheres, auf Phrasenebene arbeitendes Kommunikationswerkzeug verwandeln kann.

Zitation: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7

Schlüsselwörter: Brain‑Computer‑Interface, P300‑Speller, unterstützte Kommunikation, Wortvorhersage, große Sprachmodelle