Clear Sky Science · es

ChatBCI, un BCI de deletreo P300 con predicción de palabras guiada por contexto aprovechando modelos de lenguaje a gran escala, desde el concepto hasta la evaluación

· Volver al índice

Dar voz a los pensamientos

Para las personas que no pueden hablar o moverse con facilidad, comunicar incluso una petición simple puede ser lento y agotador. Este estudio presenta ChatBCI, una interfaz cerebro‑ordenador que permite a los usuarios deletrear palabras en una pantalla usando solo sus señales cerebrales, mientras un potente modelo de lenguaje (similar a ChatGPT) predice lo que quieren decir a continuación. Al combinar las señales cerebrales con una predicción inteligente de palabras, el sistema pretende hacer la comunicación más rápida, menos fatigante y más parecida a una conversación cotidiana.

Figure 1
Figure 1.

Cómo el cerebro habla con un ordenador

ChatBCI se basa en un enfoque conocido como deletreo P300. En este sistema, una cuadrícula de letras y teclas funcionales parpadea en la pantalla del ordenador. Cuando un usuario se concentra en silencio en la letra que desea, su cerebro produce una señal breve y característica unos 300 milisegundos después de que parpadee la fila o columna de esa letra. Electrodos en una gorra EEG registran esos pequeños cambios de voltaje, y el software detecta qué fila y columna generaron la respuesta más fuerte, revelando la tecla deseada. Tradicionalmente, los usuarios deben elegir cada letra una por una, lo que es preciso pero dolorosamente lento y mentalmente exigente para frases largas.

Añadir predicción inteligente de palabras

La innovación de ChatBCI es integrar un modelo de lenguaje a gran escala directamente en este proceso de deletreo. El teclado en pantalla sigue mostrando letras, pero ahora también exhibe diez sugerencias de palabras a los lados: candidatas proporcionadas en tiempo real por un modelo GPT‑3.5 en línea. En cuanto el usuario deletrea parte de una palabra o una frase corta, la frase parcial se envía como texto al modelo de lenguaje. Un prompt cuidadosamente diseñado instruye al modelo para que devuelva una lista compacta de palabras o completaciones probables. El sistema analiza esa respuesta y transforma cada palabra sugerida en una tecla seleccionable en el teclado. Seleccionar una de estas sugerencias inserta instantáneamente la palabra completa (o incluso una frase corta) y añade un espacio, de modo que el usuario puede construir frases mucho más rápido que eligiendo letras una por una.

Figure 2
Figure 2.

Poner a prueba ChatBCI

Siete voluntarios probaron ChatBCI en varias etapas. Primero, se registraron sus patrones cerebrales individuales mientras se concentraban en teclas conocidas, lo que permitió al sistema entrenar un clasificador que reconoce la señal P300. Luego completaron dos tareas de entrada de texto realistas. En una tarea de deletreo por copia, cada persona eligió una imagen, creó una frase significativa sobre ella (como una petición de agua o indicar un baño) y después deletreó esa frase de dos maneras: una vez usando ChatBCI con sugerencias de palabras y otra con un modo tradicional letra por letra con las sugerencias desactivadas. En una segunda tarea de improvisación, se les pidió que compusieran libremente su propia frase empezando por una letra elegida, animándoles a confiar tanto como fuera posible en las palabras sugeridas en lugar de deletrear todo desde cero.

Mensajes más rápidos, menos pulsaciones

Los resultados mostraron beneficios claros al combinar señales cerebrales con predicción lingüística. En la tarea de copia, usar ChatBCI redujo el tiempo medio para escribir una frase de unos 28 minutos a aproximadamente 10 minutos —una reducción del 62%— y además más que duplicó la tasa de caracteres correctamente escritos por minuto. El número de pulsaciones necesarias se redujo aproximadamente a la mitad y la precisión mejoró: los usuarios casi siempre terminaban con frases perfectamente deletreadas al usar ChatBCI. Para cuantificar cuánto trabajo ahorra el sistema, los autores emplearon una medida de “ahorro de pulsaciones” y una nueva “ratio de déficit de ahorro de pulsaciones”, que comparan el rendimiento con sistemas idealizados que siempre podrían adivinar la palabra correcta tras una o dos acciones. En la tarea de improvisación libre, ChatBCI alcanzó en promedio alrededor de un 81% de ahorro de pulsaciones, a veces incluso superando los límites teóricos porque el modelo de lenguaje ocasionalmente sugería frases de varias palabras que podían insertarse con una única selección.

Qué significa esto para la comunicación en el mundo real

Para los usuarios cotidianos —especialmente aquellos con limitaciones severas de movimiento o del habla—, el resultado clave es sencillo: ChatBCI permite a las personas decir más con menos esfuerzo mental y en mucho menos tiempo. Al externalizar la predicción del lenguaje a un modelo a gran escala en la nube, el sistema evita la necesidad de entrenamiento local o grandes diccionarios, pero aun así se adapta a la frase que el usuario desea crear. Aunque se necesita más trabajo en poblaciones clínicas y para abordar la privacidad, el coste y la fiabilidad de los modelos de lenguaje en la nube, este estudio muestra que emparejar interfaces cerebrales con tecnología lingüística moderna puede transformar el deletreo lento letra por letra en una herramienta de conversación más natural a nivel de frase.

Cita: Hong, J., Wang, W. & Najafizadeh, L. ChatBCI, a P300 speller BCI with context-driven word prediction leveraging large language models, from concept to evaluation. Sci Rep 16, 6379 (2026). https://doi.org/10.1038/s41598-025-25660-7

Palabras clave: interfaz cerebro-ordenador, deletreo P300, comunicación asistida, predicción de palabras, modelos de lenguaje a gran escala