Clear Sky Science · ru
ChatBCI, BCI P300-спеллер с предсказанием слов на основе контекста с использованием больших языковых моделей: от концепции до оценки
Дать голос мыслям
Для людей, которые не могут легко говорить или двигаться, даже простая просьба может быть медленной и утомительной. В этом исследовании представлен ChatBCI — интерфейс «мозг‑компьютер», который позволяет пользователям прописывать слова на экране, используя только сигналы мозга, в то время как мощная языковая модель (аналогичная ChatGPT) предсказывает, что они хотят сказать дальше. Сочетая сигналы мозга с интеллектуальным предсказанием слов, система стремится сделать общение быстрее, менее утомительным и ближе к повседневной беседе.

Как мозг «разговаривает» с компьютером
ChatBCI опирается на хорошо известный подход, называемый P300‑спеллером. В этой схеме на экране отображается сетка букв и функциональных клавиш, которые мигают. Когда пользователь молча фокусируется на нужной букве, его мозг генерирует краткий характерный сигнал примерно через 300 миллисекунд после мигания строки или столбца с этой буквой. Электроды на электроэнцефалографической кепке регистрируют эти крошечные изменения напряжения, а программное обеспечение определяет, какая строка и столбец вызвали наиболее сильную реакцию, раскрывая предполагаемую клавишу. Традиционно пользователям приходится выбирать каждую букву по отдельности, что обеспечивает точность, но чрезвычайно медленно и умственно утомительно при наборе длинных предложений.
Добавление интеллектуального предсказания слов
Инновация ChatBCI заключается во встраивании большой языковой модели непосредственно в процесс набора. На экране по‑прежнему видны буквы, но теперь по бокам отображается также десять подсказок слов — кандидатов, предоставленных в реальном времени онлайн‑моделью GPT‑3.5. Как только пользователь набирает часть слова или короткой фразы, фрагмент предложения отправляется в виде текста языковой модели. Тщательно составленный запрос просит модель вернуть компактный список вероятных следующих слов или завершений. Система парсит этот ответ и превращает каждое предложенное слово в выбираемую клавишу на клавиатуре. Выбор одной из подсказок мгновенно вставляет целое слово (или даже короткую фразу) и добавляет пробел, так что пользователь может строить предложения значительно быстрее, чем выбирая буквы по одной.

Испытание ChatBCI
Семь добровольцев протестировали ChatBCI в несколько этапов. Сначала их индивидуальные мозговые шаблоны были записаны, пока они фокусировались на известных клавишах, что позволило системе обучить классификатор, распознающий сигнал P300. Затем они выполнили два реалистичных задания по вводу текста. В задаче копирования‑набора каждый участник выбирал картинку, придумывал осмысленное предложение о ней (например, просьбу о воде или указание на туалет), а затем набирал это предложение двумя способами: один раз с помощью ChatBCI с подсказками слов и один раз в традиционном режиме буква за буквой с отключёнными подсказками. Во втором, импровизационном задании, их просили свободно сочинить собственное предложение, начиная с выбранной буквы, поощряя полагаться как можно больше на предложенные слова, а не на набор всего с нуля.
Быстрее сообщения, меньше нажатий клавиш
Результаты показали явные преимущества сочетания сигналов мозга с языковым предсказанием. В задаче копирования‑набора использование ChatBCI сократило среднее время написания предложения примерно с 28 минут до примерно 10 минут — снижение на 62% — при этом более чем вдвое возросла скорость правильно набранных символов в минуту. Количество необходимых нажатий клавиш уменьшилось примерно вдвое, а точность улучшилась: при использовании ChatBCI пользователи почти всегда получали идеально набранные предложения. Чтобы оценить, сколько работы экономит система, авторы использовали меру «экономии на нажатиях клавиш» и новую «дефицитную долю экономии на нажатиях клавиш», которые сравнивают производительность с идеализированными системами, всегда угадывающими правильное слово после одного или двух действий. В задаче свободной импровизации ChatBCI достигал в среднем около 81% экономии на нажатиях клавиш, иногда даже превосходя теоретические пределы, потому что языковая модель иногда предлагала многословные фразы, которые можно было вставить одним выбором.
Что это значит для реального общения
Для повседневных пользователей — особенно для тех, у кого серьёзные ограничения по движению или речи — ключевой вывод прост: ChatBCI позволяет людям сказать больше при меньших умственных усилиях и за гораздо меньшее время. Перенося предсказание языка на удалённую большую языковую модель, система избегает необходимости в локальном обучении или больших словарях, но при этом адаптируется к любому предложению, которое пользователь хочет составить. Хотя потребуются дальнейшие исследования в клинических группах и работа по вопросам приватности, стоимости и надёжности облачных языковых моделей, это исследование показывает, что сочетание мозговых интерфейсов с современной языковой технологией может превратить медленный букво‑за‑буквой набор в более естественный инструмент для общения на уровне фраз.
Цитирование: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7
Ключевые слова: интерфейс «мозг‑компьютер», P300-спеллер, помогающая коммуникация, предсказание слов, большие языковые модели