Clear Sky Science · pl
ChatBCI, interfejs mózg‑komputer typu P300 z kontekstowym przewidywaniem słów wykorzystującym duże modele językowe — od koncepcji do oceny
Umożliwianie głosu myślom
Dla osób, które nie mogą mówić lub poruszać się swobodnie, przekazanie nawet prostego życzenia może być powolne i wyczerpujące. W tym badaniu przedstawiono ChatBCI — interfejs mózg–komputer, który pozwala użytkownikom literować słowa na ekranie, używając wyłącznie sygnałów mózgowych, podczas gdy zaawansowany model językowy (podobny do ChatGPT) przewiduje, co chcą powiedzieć dalej. Łącząc sygnały mózgowe z inteligentną predykcją słów, system ma na celu przyspieszenie komunikacji, zmniejszenie zmęczenia i przybliżenie jej do codziennej rozmowy.

Jak mózg „mówi” z komputerem
ChatBCI opiera się na znanym podejściu zwanym P300 speller. W tym układzie na ekranie komputera pojawia się siatka liter i klawiszy funkcyjnych, które błyskają. Gdy użytkownik w ciszy skupia się na literze, którą chce wybrać, jego mózg generuje krótki, charakterystyczny sygnał około 300 milisekund po błysku odpowiedniego wiersza lub kolumny. Elektrody na czepku EEG rejestrują te niewielkie zmiany napięcia, a oprogramowanie wykrywa, który wiersz i kolumna wywołały najsilniejszą odpowiedź, ujawniając zamierzony klawisz. Tradycyjnie użytkownicy muszą wybierać każdą literę pojedynczo, co jest dokładne, ale niezwykle wolne i obciążające psychicznie przy dłuższych zdaniach.
Dodanie inteligentnej predykcji słów
Innowacją ChatBCI jest włączenie dużego modelu językowego bezpośrednio do procesu literowania. Klawiatura na ekranie nadal pokazuje litery, ale teraz po bokach wyświetla też dziesięć propozycji słów — kandydatów generowanych w czasie rzeczywistym przez model GPT‑3.5 działający online. Gdy użytkownik wpisze część słowa lub krótką frazę, częściowe zdanie jest wysyłane jako tekst do modelu językowego. Starannie przygotowany prompt każe modelowi zwrócić zwarte listy prawdopodobnych kolejnych słów lub dokończeń. System parsuje tę odpowiedź i zamienia każde zaproponowane słowo w wybieralny klawisz na klawiaturze. Wybranie jednej z sugestii natychmiast wstawia całe słowo (a nawet krótką frazę) i dodaje spację, dzięki czemu użytkownik może budować zdania znacznie szybciej niż wybierając litery pojedynczo.

Testowanie ChatBCI
Siedmiu ochotników przetestowało ChatBCI w kilku etapach. Najpierw zarejestrowano indywidualne wzorce ich mózgu podczas skupiania się na znanych klawiszach, co pozwoliło systemowi wytrenować klasyfikator rozpoznający sygnał P300. Następnie wykonali dwa realistyczne zadania wprowadzania tekstu. W zadaniu przepisywania każdy uczestnik wybrał obrazek, wymyślił na jego temat sensowne zdanie (na przykład prośbę o wodę lub informacje o toalecie), a potem przeliterował to zdanie na dwa sposoby: raz używając ChatBCI z sugestiami słów i raz w tradycyjnym trybie litera po literze ze wskazówkami wyłączonymi. W drugim, improwizacyjnym zadaniu proszono ich o swobodne ułożenie własnego zdania zaczynającego się od wybranej litery, z zachętą do możliwie jak największego korzystania z proponowanych słów zamiast literowania wszystkiego od podstaw.
Szybsze wiadomości, mniej naciśnięć klawiszy
Wyniki wykazały wyraźne korzyści z połączenia sygnałów mózgowych z predykcją językową. W zadaniu przepisywania użycie ChatBCI skróciło średni czas napisania zdania z około 28 minut do około 10 minut — o 62% mniej — równocześnie więcej niż podwajając szybkość poprawnych znaków wpisywanych na minutę. Liczba wymaganych naciśnięć klawiszy spadła o około połowę, a dokładność poprawiła się: użytkownicy niemal zawsze uzyskiwali idealnie napisane zdania korzystając z ChatBCI. Aby uchwycić, ile pracy system oszczędza, autorzy zastosowali miarę „oszczędności naciśnięć klawiszy” oraz nowy „współczynnik deficytu oszczędności naciśnięć”, porównujące wydajność z idealizowanymi systemami, które zawsze potrafiłyby zgadnąć właściwe słowo po jednej lub dwóch akcjach. W zadaniu improwizacyjnym ChatBCI osiągnęło średnio około 81% oszczędności naciśnięć klawiszy, czasami nawet przekraczając teoretyczne granice, ponieważ model językowy okazjonalnie proponował wielowyrazowe frazy, które można było wstawić jednym wyborem.
Co to znaczy dla komunikacji w świecie rzeczywistym
Dla codziennych użytkowników — zwłaszcza tych z poważnymi ograniczeniami ruchu lub mowy — kluczowy wniosek jest prosty: ChatBCI pozwala mówić więcej przy mniejszym nakładzie mentalnym i w znacznie krótszym czasie. Dzięki powierzeniu predykcji językowej zdalnemu dużemu modelowi językowemu, system unika potrzeby lokalnego trenowania modeli czy obszernego słownika, a jednocześnie dostosowuje się do dowolnego zdania, które użytkownik chce stworzyć. Choć potrzebne są dalsze badania w populacjach klinicznych oraz rozwiązania dotyczące prywatności, kosztów i niezawodności modeli chmurowych, to badanie pokazuje, że łączenie interfejsów mózgowych z nowoczesną technologią językową może przekształcić powolne literowanie w narzędzie rozmowy na poziomie fraz, bliższe naturalnej konwersacji.
Cytowanie: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7
Słowa kluczowe: interfejs mózg‑komputer, P300 speller, komunikacja wspomagająca, predykcja słów, duże modele językowe