Clear Sky Science · sv

ChatBCI, en P300‑speller BCI med kontextstyrd ordprediktion som utnyttjar stora språkmodeller, från koncept till utvärdering

· Tillbaka till index

Ge tankar en röst

För personer som inte kan tala eller röra sig enkelt kan det vara både långsamt och utmattande att kommunicera även en enkel begäran. Denna studie presenterar ChatBCI, ett hjärn‑datorgränssnitt som låter användare stava ord på en skärm med enbart sina hjärnsignaler, samtidigt som en kraftfull språkmodell (liknande ChatGPT) förutspår vad de vill säga härnäst. Genom att förena hjärnsignaler med smart ordprediktion syftar systemet till att göra kommunikationen snabbare, mindre ansträngande och mer lik vardagligt samtal.

Figure 1
Figure 1.

Hur hjärnan pratar med en dator

ChatBCI bygger på en välkänd metod kallad P300‑speller. I den här lösningen blinkar ett rutnät av bokstäver och funktionsknappar på en datorskärm. När en användare tyst fokuserar på bokstaven de vill ha, skapar hjärnan en kort, karaktäristisk signal cirka 300 millisekunder efter att den bokstavens rad eller kolumn blinkat. Elektroder på en EEG‑mössa registrerar dessa små spänningsförändringar, och programvara upptäcker vilken rad och kolumn som gav starkast respons, vilket avslöjar önskad knapp. Traditionellt måste användare välja varje bokstav en i taget, vilket är noggrant men smärtsamt långsamt och mentalt krävande för långa meningar.

Lägga till smart ordprediktion

Nyheten i ChatBCI är att koppla en stor språkmodell direkt till stavningsprocessen. Tangentbordet på skärmen visar fortfarande bokstäver, men visar nu också tio ordförslag längs sidorna — kandidater som levereras i realtid av en online GPT‑3.5‑modell. Så snart användaren stavar en del av ett ord eller en kort fras skickas den partiella meningen som text till språkmodellen. En noggrant utformad prompt ber modellen att returnera en kompakt lista med troliga nästa ord eller kompletteringar. Systemet tolkar svaret och omvandlar varje föreslaget ord till en valbar knapp på tangentbordet. Att välja ett av dessa förslag infogar omedelbart hela ordet (eller till och med en kort fras) och lägger till ett blanksteg, så användaren kan bygga meningar mycket snabbare än genom att välja bokstäver en och en.

Figure 2
Figure 2.

Sätta ChatBCI på prov

Sju frivilliga testade ChatBCI i flera steg. Först registrerades deras individuella hjärnmönster medan de fokuserade på kända tangenter, vilket gjorde det möjligt för systemet att träna en klassificerare som känner igen P300‑signalen. Därefter utförde de två realistiska textinmatningsuppgifter. I en kopiera‑stava‑uppgift valde varje person en bild, hittade på en meningsfull mening om den (till exempel en begäran om vatten eller en toalett) och stavade sedan den meningen på två sätt: en gång med ChatBCI med ordförslag och en gång med ett traditionellt bokstav‑för‑bokstav‑läge med förslag avstängt. I en andra, improvisationsuppgift ombads de fritt formulera en egen mening som startade med en vald bokstav, uppmuntrade att förlita sig så mycket som möjligt på de föreslagna orden istället för att stava allt från grunden.

Snabbare meddelanden, färre tangentryck

Resultaten visade tydliga fördelar med att kombinera hjärnsignaler och språkprediktion. I kopiera‑stava‑uppgiften minskade tiden att skriva en mening i genomsnitt från cirka 28 minuter till ungefär 10 minuter — en reduktion med 62 % — samtidigt som takten av korrekt skrivna tecken per minut mer än fördubblades. Antalet nödvändiga tangentryck minskade med ungefär hälften och noggrannheten förbättrades: användarna fick nästan alltid perfekt stavade meningar när de använde ChatBCI. För att fånga hur mycket arbete systemet sparar använde författarna en måttstock kallad ”keystroke savings” och en ny ”keystroke savings deficit ratio”, som jämför prestanda med idealiserade system som alltid kunde gissa rätt ord efter en eller två åtgärder. I den fria improvisationsuppgiften uppnådde ChatBCI i genomsnitt cirka 81 % tangentsparande, ibland till och med överträffande de teoretiska gränserna eftersom språkmodellen ibland föreslog flervalsfraser som kunde infogas med ett enda val.

Vad detta betyder för verklig kommunikation

För vardagsanvändare — särskilt de med svåra rörelse‑ eller talbegränsningar — är huvudresultatet enkelt: ChatBCI låter människor säga mer med mindre mental ansträngning och på mycket kortare tid. Genom att lägga språkprediktionen på en fjärransluten stor språkmodell undviker systemet behovet av lokal träning eller stora ordlistor, samtidigt som det anpassar sig till vilken mening användaren än vill skapa. Även om vidare arbete krävs i kliniska populationer och för att hantera integritet, kostnad och tillförlitlighet hos molnbaserade språkmodeller, visar denna studie att kombinationen av hjärngränssnitt och modern språkteknik kan förvandla långsam bokstav‑för‑bokstav‑stavning till ett mer naturligt, frasnivåbaserat samtalsverktyg.

Citering: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7

Nyckelord: hjärn-datorgränssnitt, P300‑speller, hjälpmedelskommunikation, ordprediktion, stora språkmodeller