Clear Sky Science · es

Computación in situ de datos con arquitectura de un píxel-múltiples memristores para visión secuencial neuromórfica

2026-03-19 · Volver al índice

Por qué importa una visión más rápida

Cada vez que una cámara en un teléfono, robot o coche autónomo registra el mundo, primero debe capturar las imágenes y luego enviarlas a un chip separado para su análisis. Este ir y venir desperdicia tiempo y energía, especialmente en flujos de vídeo. El estudio que sustenta este artículo explora un nuevo tipo de “ojo” electrónico que puede tanto almacenar como procesar la información visual casi donde la luz incide por primera vez, tomando prestada la inspiración de cómo el cerebro humano maneja las escenas en movimiento.

Cómo manejan el movimiento nuestros ojos y cerebro

En las personas, el ojo convierte la luz en pequeños impulsos eléctricos que viajan por los nervios hasta el cerebro. Allí, una especie de memoria visual a corto plazo retiene las imágenes recientes y realiza una clasificación preliminar rápida antes de que ocurra un reconocimiento más profundo. Este filtrado temprano reduce la cantidad de información que debe moverse, ayudando al cerebro a ser veloz y eficiente energéticamente. El nuevo trabajo toma esta idea con el objetivo de dotar a los sistemas de visión artificial de su propia memoria visual de trabajo local.

Figure 1. Ojo artificial que almacena y analiza imágenes en movimiento directamente en su propia cuadrícula de memoria para una visión más rápida y con menor consumo energético.

Una nueva colaboración entre píxel y memoria

Los investigadores construyeron un sistema de hardware en el que cada píxel sensor de luz está vinculado a muchos pequeños elementos de memoria en un chip. Estos elementos, llamados memristores, pueden almacenar un rango de valores, no solo encendido y apagado, lo que los hace adecuados para conservar matices de brillo. En el diseño, un circuito analógico simple convierte la señal de luz del píxel en un voltaje que programa directamente varios memristores a la vez. Esta disposición de un píxel a muchos memristores crea un mapa compacto de la escena directamente en la matriz de memoria, similar a cómo las fibras nerviosas de la retina se ramifican hacia muchas células cerebrales.

Recorriendo las imágenes rápidamente

Para capturar imágenes en movimiento de forma eficiente, el equipo introdujo una estrategia de “exposición rodante”. En lugar de capturar un fotograma completo y enviarlo, el sistema escribe una columna de píxeles en la matriz de memristores y luego pasa rápidamente a la siguiente columna hasta que la imagen completa está almacenada. Un método especial de pulso único programa muchos memristores en paralelo, intercambiando un poco de precisión por una gran ganancia en velocidad. Pruebas con siluetas de acciones humanas sencillas y un retrato muestran que las imágenes restauradas desde el chip conservan las formas y rostros clave con suficiente claridad para un reconocimiento fiable, aunque aparece algo de ruido pequeño.

Figure 2. Las señales de píxeles llenan una matriz de memristores columna por columna y, luego, el procesamiento in situ transforma esos patrones en categorías de acción.

Pensar donde viven las imágenes

La mayoría del hardware de visión inteligente actual todavía separa la detección, el almacenamiento y el cálculo. En contraste, este sistema realiza parte del “pensamiento” directamente dentro de la misma matriz de memristores que contiene la imagen. Los investigadores aplican patrones de voltaje cuidadosamente escogidos a la imagen almacenada, permitiendo que la propia matriz lleve a cabo los pasos matemáticos básicos de una red neuronal. Solo los resultados condensados viajan luego a un segundo bloque de memristores que completa la clasificación. En pruebas con un conocido conjunto de datos de acciones humanas, el hardware reconoció movimientos como correr, saltar y caminar con un 95,7 por ciento de precisión, cercano a las simulaciones por ordenador.

Por qué este enfoque podría remodelar los ojos de las máquinas

Porque la detección, el almacenamiento a corto plazo y el procesamiento temprano están estrechamente entrelazados, la nueva arquitectura reduce en gran medida la necesidad de mover datos entre chips separados. Los autores estiman que su diseño puede disminuir la latencia entre la captura y el almacenamiento de la imagen en aproximadamente dos mil veces, y reducir la energía para el procesamiento de imágenes en unas 160 veces en comparación con un sistema digital típico que usa memoria estándar. Para los usuarios cotidianos, eso podría algún día traducirse en cámaras y dispositivos guiados por visión más pequeños, más fríos y más sensibles que observan el mundo más como nosotros, tomando solo lo que necesitan de cada instante.

Cita: Sun, Y., Tong, P., Shen, J. et al. Data-In-situ Computing with One-Pixel-Multiple-Memristor Architecture for Neuromorphic Sequential Vision. Nat Commun 17, 4244 (2026). https://doi.org/10.1038/s41467-026-70860-y

Palabras clave: visión neuromórfica, memristor, computación en memoria, imágenes secuenciales, IA eficiente en energía