Clear Sky Science · zh
ChatBCI:一种结合上下文驱动词预测并利用大型语言模型的P300拼写脑机接口,从概念到评估
赋思想以声音
对于无法言语或行动不便的人来说,即便是简单的请求也可能缓慢且耗尽精力。本研究介绍了ChatBCI,一种脑—机接口,允许用户仅通过脑电信号在屏幕上拼写单词,同时由一个强大的语言模型(类似于ChatGPT)预测他们接下来想要说的话。通过将脑信号与智能词预测结合,该系统旨在使交流更快、疲劳更少,并更接近日常对话。

大脑如何与计算机对话
ChatBCI 基于一种广为人知的方法——P300拼写器。在这种设置中,计算机屏幕上会显示一个字母和功能键的网格。当用户在心里专注于目标字母时,大脑在该字母所在的行或列闪烁后约300毫秒会产生一个短暂的、特征性的信号。脑电帽上的电极记录这些微小的电压变化,软件则检测哪个行和列产生了最强的反应,从而识别出目标键。传统上,用户必须逐个选择字母,这虽然准确,但对于长句来说既极其缓慢又精神消耗大。
加入智能词预测
ChatBCI 的创新在于将大型语言模型直接接入拼写流程。屏幕键盘仍显示字母,但现在两侧还会显示十个词建议——由在线的 GPT‑3.5 模型实时提供的候选词。当用户拼出部分单词或短语时,该部分句子作为文本发送给语言模型。经过精心设计的提示会要求模型返回一组简洁的、最可能的下一个词或补全。系统解析模型的响应并将每个建议词转换为键盘上的可选键。选择任一建议会立即插入整个单词(或短短的短语)并添加空格,使用户能够比一字一字选择更快地构建句子。

将 ChatBCI 付诸测试
七名志愿者在若干阶段中测试了 ChatBCI。首先,在他们专注于已知按键时记录各自的大脑模式,以便系统训练出能识别P300信号的分类器。然后他们完成了两项真实感的文本输入任务。在复制拼写任务中,每位被试选择一张图片,为其构思一句有意义的句子(例如请求水或指卫生间),并以两种方式拼出该句子:一次使用带有词建议的 ChatBCI,另一次使用传统的逐字母模式且关闭建议。在第二项即兴创作任务中,被要求从所选字母开始自由创作句子,并鼓励尽可能多地依赖建议词,而不是从头拼出每个字。
更快的消息,减少的按键次数
结果显示,将脑信号与语言预测结合带来了明显好处。在复制拼写任务中,使用 ChatBCI 将写一句话的平均时间从约28分钟缩短到大约10分钟——减少了62%——同时每分钟正确输入的字符速率也增加了一倍多。所需按键次数大约减少了一半,且准确性有所提高:使用 ChatBCI 时,用户几乎总能得到拼写正确的句子。为量化系统节省的工作量,作者使用了“按键节省”指标和一个新的“按键节省亏缺比”,将性能与那些理想化系统(能在一次或两次操作后总是猜对词)进行比较。在自由即兴任务中,ChatBCI 平均实现了约81%的按键节省,有时甚至超过理论极限,因为语言模型会偶尔建议可以用一次选择插入的多词短语。
对真实世界交流的意义
对日常用户——尤其是运动或言语严重受限的人——来说,关键结论很简单:ChatBCI 让人们以更少的心理努力和更短的时间表达更多内容。通过将语言预测外包给远程的大型语言模型,系统避免了对本地训练或大型词典的需求,同时仍能适应用户想要创建的任意句子。尽管在临床人群中还需进一步研究,并需解决云端语言模型的隐私、成本和可靠性问题,本研究表明,将脑接口与现代语言技术配对,能够把缓慢的逐字拼写转变为更自然的短语级对话工具。
引用: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7
关键词: 脑机接口, P300拼写器, 辅助交流, 词预测, 大型语言模型