Clear Sky Science · es

Una red neuronal para modelar la formación, comprensión y comunicación de conceptos humanos

2026-02-19 · Volver al índice

Cómo las mentes transforman lo que ven en ideas

Cuando escuchas la palabra «cena», puedes imaginar una mesa, olores y sonidos, incluso sin ver comida. Esta capacidad de convertir imágenes y sonidos ricos en ideas compactas y luego recuperarlas más tarde sostiene el lenguaje, la planificación y el entendimiento compartido. El artículo presenta un nuevo tipo de red neuronal artificial que intenta capturar esta magia cotidiana de la mente humana, ofreciendo pistas sobre cómo el cerebro podría organizar el conocimiento y cómo futuras máquinas podrían pensar de forma más similar a las personas.

Figure 1. Cómo códigos conceptuales comprimidos convierten experiencias visuales variadas en decisiones flexibles y en entendimiento compartido entre sistemas.

Comprimir experiencias ricas en códigos sencillos

Los autores parten de una pregunta simple: ¿cómo comprime el cerebro la entrada sensorial detallada en un conjunto más pequeño de conceptos y luego usa esos conceptos con flexibilidad? Las redes artificiales actuales son muy buenas reconociendo imágenes, pero ocultan lo que aprenden dentro de millones de parámetros, lo que dificulta reutilizar el conocimiento o compartirlo con otros sistemas. Los grandes modelos de lenguaje, en cambio, dependen de palabras humanas ya existentes, en lugar de construir conceptos directamente a partir de imágenes y sonidos. El nuevo marco, llamado CATS Net, está diseñado para modelar tanto la formación de conceptos como su uso dentro de un único sistema, partiendo únicamente de tareas visuales.

Dos módulos cooperantes para conceptos y decisiones

CATS Net divide el pensamiento en dos partes que interactúan. Un módulo de abstracción de conceptos aprende un código numérico corto, o «vector de concepto», para cada tipo de objeto, como manzanas o autobuses, a partir de ejemplos visuales. Un módulo separado de resolución de tareas recibe características de imagen de una columna vertebral visual estándar y debe responder preguntas simples de sí o no como «¿Es esto una manzana?» El truco clave es un proceso de enmascaramiento (gating): el vector de concepto controla cómo fluye la actividad a través de las capas de resolución de tareas, remodelando la misma red para manejar distintos conceptos sin cambiar su cableado central. El entrenamiento alterna entre ajustar los módulos y modificar los vectores de concepto, de modo que tanto la red como sus conceptos internos se especializan gradualmente.

Descubriendo un mapa de significado semejante al humano

Una vez entrenada en grandes conjuntos de imágenes, CATS Net no solo clasifica imágenes inéditas con alta precisión, sino que también desarrolla un «espacio de conceptos» organizado. Los códigos cercanos suelen representar cosas relacionadas, como animales agrupándose o herramientas formando su propio grupo. Los autores demuestran que esta disposición no es arbitraria: coincide con patrones hallados en estudios humanos donde las personas evalúan la similitud entre objetos, y con modelos basados en lenguaje que describen el significado a lo largo de muchas dimensiones, como comida, mobiliario o valor emocional. De forma notable, cuando los investigadores comparan los patrones internos de similitud de la red con escáneres cerebrales tomados mientras los voluntarios nombran objetos, encuentran que la capa de conceptos se alinea con la actividad en una región visual de alto nivel y que el módulo de enmascaramiento se asemeja a áreas implicadas en el control del acceso al significado.

Compartir conocimiento solo a través de conceptos

El estudio también explora si conceptos de baja dimensión pueden servir como moneda común entre diferentes redes. El equipo entrena versiones separadas de CATS Net como «profesor» y «estudiante» en conjuntos de categorías solapadas, y luego añade un pequeño módulo de traducción que mapea los vectores de concepto del espacio del profesor al del estudiante. Sin cambiar los pesos principales de la red, el estudiante puede usar un vector de concepto traducido para una categoría que nunca vio durante el entrenamiento y aún así rendir muy por encima del azar en juicios de sí o no. En otras pruebas, CATS Net utiliza con éxito espacios conceptuales derivados de humanos construidos a partir de estadísticas lingüísticas y datos conductuales, tratándolos como si fuesen sus propios códigos internos.

Figure 2. Cómo un vector de concepto regula las capas de una red neuronal para que la misma circuitería resuelva distintas tareas binarias basadas en imágenes.

Por qué esto importa para mentes y máquinas

En conjunto, estos resultados sugieren que códigos conceptuales compactos, combinados con un enmascaramiento flexible del procesamiento sensorial, pueden ofrecer una receta viable para el pensamiento conceptual semejante al humano. El modelo muestra cómo experiencias visuales ricas pueden comprimirse en representaciones reutilizables y compartibles que coinciden con patrones tanto en el comportamiento humano como en la actividad cerebral. Aunque el trabajo se centra en objetos concretos que podemos ver y nombrar, apunta hacia sistemas futuros que también podrían capturar ideas más abstractas, acercando la inteligencia artificial a la forma en que las personas forman, comprenden y comunican conceptos.

Cita: Guo, L., Chen, H., Chen, Y. et al. A neural network for modeling human concept formation, understanding and communication. Nat Comput Sci 6, 497–511 (2026). https://doi.org/10.1038/s43588-026-00956-4

Palabras clave: formación de conceptos, redes neuronales, cognición semántica, alineamiento cerebral, comunicación de conceptos