Clear Sky Science · es
Lograr una visión más parecida a la del cerebro humano mediante la alineación representacional con EEG humano
Por qué importa esta investigación
La inteligencia artificial moderna puede reconocer objetos en fotografías con una precisión cercana a la humana, pero todavía no “ve” el mundo de la misma manera que lo hace nuestro cerebro. Este estudio presenta una nueva forma de ajustar los sistemas de visión por ordenador usando señales cerebrales registradas de voluntarios, acercando la IA un paso más a una comprensión visual similar a la humana. Al modelar directamente la actividad cerebral en un sistema de visión, el trabajo apunta hacia futuras inteligencias artificiales que no solo sean potentes, sino también organizadas de una manera más parecida a nuestra propia mente.

Enseñar a las máquinas con ondas cerebrales
Los autores se centran en una idea simple pero audaz: en lugar de entrenar modelos de visión solo con imágenes y etiquetas, ¿por qué no mostrarles también cómo responde el cerebro humano a esas imágenes? Usan electroencefalografía (EEG), que mide pequeños cambios de voltaje en el cuero cabelludo mientras las personas miran imágenes. El EEG es no invasivo, relativamente barato y puede recogerse rápidamente en muchos ensayos. Con datos de diez voluntarios, el equipo empleó un gran conjunto de datos abierto en el que cada persona vio decenas de miles de imágenes de objetos naturales mientras se registraban sus señales EEG en los primeros dos décimos de segundo tras la aparición de cada imagen.
Construir una red de visión alineada con el cerebro
Partiendo de un modelo profundo de visión existente llamado CORnet-S, los investigadores añadieron un módulo extra de “imagen a cerebro”. Cuando una imagen entra en la red, el modelo ahora realiza dos tareas a la vez: sospecha qué objeto está presente y trata de predecir el patrón de EEG que un humano real mostró para esa misma imagen. Para ello, las señales de varias capas internas de la red se canalizan hacia el módulo EEG, que aprende a generar una breve serie temporal que coincide con los datos humanos. Durante el entrenamiento, el modelo es recompensado tanto por el reconocimiento correcto del objeto como por producir actividad similar a EEG, empujando sus características internas a parecerse a las del sistema visual humano.
Más parecido a la actividad cerebral según varios métodos
Tras entrenar diez de estas “ReAlnets” (una por sujeto), el equipo preguntó si estos modelos se habían vuelto realmente más parecidos al cerebro. Compararon el patrón de relaciones entre imágenes dentro del modelo con el patrón observado en el EEG humano, usando una técnica llamada análisis de similitud representacional. A lo largo de todas las capas principales y de los puntos temporales entre 50 y 200 milisegundos, las ReAlnets fueron sistemáticamente más similares al EEG humano que el CORnet-S original y otros modelos estándar, con ganancias máximas de hasta aproximadamente un 6% y mejoras relativas de hasta un 40%. Es importante que el impulso se mantuvo incluso para nuevas categorías de objetos nunca utilizadas durante el entrenamiento, lo que muestra que la alineación se generaliza más allá del conjunto de entrenamiento.

Conexión con escáneres cerebrales y comportamiento
Una pregunta clave es si los modelos simplemente aprendieron idiosincrasias del EEG o captaron algo más general sobre la visión humana. Para comprobarlo, los autores recurrieron a un conjunto de datos de imagen cerebral distinto, en el que diferentes voluntarios vieron imágenes naturales, formas abstractas y letras dentro de un escáner de resonancia magnética (MRI). Aunque las ReAlnets nunca habían visto estos datos, sus patrones internos coincidían más estrechamente con las señales de varias regiones visuales del cerebro que el modelo original. Además, el grado de mejora para EEG y para MRI se correlacionó fuertemente entre los modelos, lo que sugiere que se fortaleció una representación central compartida. Los investigadores también evaluaron con qué frecuencia los modelos y los humanos cometían errores similares en tareas exigentes de reconocimiento de objetos. Allí también, las ReAlnets se alinearon mejor con el comportamiento humano que los modelos de referencia.
Visión cerebramente parecida, personalizada y general
Dado que cada ReAlnet se ajustó al EEG de una persona, los autores pudieron explorar diferencias individuales. Encontraron que los modelos personalizados divergían entre sí más en capas profundas, reflejando cómo las diferencias entre personas aumentan desde las áreas visuales tempranas hacia las superiores. Sin embargo, el modelo de cada persona aún se generalizaba a los EEG de otras personas mejor que la línea base no alineada, mostrando que capturó tanto la estructura compartida como la específica de cada sujeto. El equipo también amplió su marco a una arquitectura diferente, ResNet18, y volvió a observar una mejor alineación con EEG, MRI y (en menor medida) comportamiento, lo que sugiere que el enfoque es flexible y no está ligado a un único diseño de modelo.
Qué significa esto para la comprensión cotidiana
Para un público no especialista, la conclusión es que ahora es posible ajustar algoritmos de visión directamente usando registros no invasivos del cerebro humano. Las ReAlnets resultantes no solo reconocen objetos; organizan la información de maneras que reflejan más de cerca nuestras propias vías visuales, a través de señales eléctricas cerebrales, escáneres MRI e incluso patrones de errores en tareas de reconocimiento. Aunque las mejoras son modestas y quedan muchos desafíos técnicos, este trabajo ofrece un paso concreto hacia sistemas de IA cuyos mecanismos internos están moldeados por el propio cerebro humano, lo que podría conducir en el futuro a tecnologías más robustas, interpretables y personalizadas.
Cita: Lu, Z., Wang, Y. & Golomb, J.D. Achieving more human brain-like vision via human EEG representational alignment. Commun Biol 9, 463 (2026). https://doi.org/10.1038/s42003-026-09685-w
Palabras clave: IA alineada con el cerebro, visión por EEG, reconocimiento de objetos, neurociencia computacional, percepción similar a la humana