Clear Sky Science · es

Controlar la memorabilidad de imágenes faciales con modelos generativos

· Volver al índice

Por qué algunos rostros permanecen en nuestra memoria

Cada día pasamos ante innumerables rostros en nuestras pantallas, pero solo unos pocos se quedan con nosotros. Anunciantes, docentes, artistas e incluso fuerzas del orden se interesan por qué imágenes recuerdan las personas y cuáles olvidan. Este estudio plantea una pregunta llamativa: ¿podemos deliberadamente aumentar la memorabilidad de una fotografía de rostro o disminuirla, manteniendo al mismo tiempo a la misma persona y un aspecto natural? Usando potentes generadores de imágenes, los autores muestran que la respuesta es en gran medida afirmativa y que la memorabilidad puede dirigirse de forma controlada.

Figure 1. Cómo la IA puede empujar fotos de rostros a ser más o menos memorables manteniéndolas naturales y realistas
Figure 1. Cómo la IA puede empujar fotos de rostros a ser más o menos memorables manteniéndolas naturales y realistas

Una nueva forma de ajustar cuán memorable es un rostro

Los investigadores se apoyan en avances recientes en inteligencia artificial generativa, en especial en un sistema llamado StyleGAN que puede crear imágenes faciales altamente realistas a partir de códigos numéricos abstractos. Cada código corresponde a un rostro. Generando una gran colección de caras sintéticas y puntuando la probabilidad de que cada una sea recordada mediante redes profundas evaluadoras de memorabilidad, el equipo crea un mapa entre esos códigos ocultos y la memoria humana. Luego usan una herramienta estadística simple para encontrar una superficie divisoria en ese espacio oculto que separa las caras más memorables de las menos memorables. Mover el código de un rostro en una dirección a través de esa superficie aumenta su memorabilidad predicha, mientras que moverlo en la dirección contraria la reduce.

Cambiar el aspecto sin cambiar quién es

Para que esto sea útil con fotografías reales, los autores primero “invierten” una imagen real en el espacio oculto de StyleGAN, encontrando un código que recrea el rostro original. Una vez hallado ese código, lo empujan a lo largo de la dirección de memorabilidad y regeneran la imagen. Las caras resultantes pertenecen a la misma persona pero ahora parecen más o menos propensas a quedarse en la memoria. Pruebas cuidadosas muestran que la identidad de las personas se conserva y que el realismo de las imágenes permanece cercano al de las salidas sin editar. El equipo también desarrolla una versión más fina y multinivel del método que ajusta la memorabilidad en varios pasos pequeños en lugar de un único salto; este control más suave mantiene la identidad aún más estable.

Qué cambia realmente cuando un rostro se vuelve memorable

Al inspeccionar miles de rostros editados, el estudio revela qué detalles visuales tienden a desplazarse cuando aumenta la memorabilidad. Los rostros más memorables a menudo parecen un poco más jóvenes, con estructura facial más delgada, piel más luminosa, maquillaje o vello facial más pronunciados y expresiones más serias. Los investigadores miden propiedades locales de la imagen alrededor de los ojos y la boca, encontrando aumentos pequeños pero fiables en el contraste de la región ocular y en la riqueza del color de los labios cuando se incrementa la memorabilidad. También descartan una explicación simple basada en el brillo general: aclarar u oscurecer uniformemente los rostros apenas altera las puntuaciones de memorabilidad en comparación con las ediciones más fuertes y localizadas producidas por su método.

Figure 2. Cómo deslizarse a lo largo de una escala visual oculta cambia sutilmente un rostro de fácilmente olvidable a altamente memorable
Figure 2. Cómo deslizarse a lo largo de una escala visual oculta cambia sutilmente un rostro de fácilmente olvidable a altamente memorable

Más allá de los rostros: objetos cotidianos

El enfoque no se limita a las personas. Los autores aplican la misma idea a imágenes de gatos, caballos, coches e iglesias creadas por otros modelos generativos. De nuevo, encuentran una dirección en el espacio de códigos ocultos que eleva o reduce la memorabilidad predicha. Para objetos, los cambios visibles a menudo implican acercar el encuadre, cambiar el punto de vista o modificar el fondo y el color de formas que hacen que el sujeto destaque. Esto sugiere que, aunque las señales visuales difieren entre rostros y objetos, el principio subyacente es similar: existen direcciones consistentes en el espacio de imágenes posibles que las hacen más o menos probables de ser recordadas.

Por qué importa la memorabilidad controlada

En términos sencillos, el artículo muestra que la memorabilidad no es solo un subproducto misterioso de una imagen; es algo que puede ajustarse con intención. Al aprender a empujar imágenes a lo largo de dimensiones visuales sutiles, los ordenadores pueden crear rostros y objetos que nuestras mentes sean más o menos propensas a almacenar. Esto tiene usos potenciales en educación, donde diagramas o ilustraciones podrían ajustarse para una mejor retención, y en comunicación y diseño, donde mensajes importantes podrían acompañarse de imágenes diseñadas para perdurar en la memoria. Al mismo tiempo, los autores subrayan la necesidad de salvaguardas éticas, ya que las mismas herramientas que hacen más efectivas las imágenes educativas podrían usarse para moldear la atención y la memoria de maneras que requieren supervisión cuidadosa.

Cita: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

Palabras clave: memorabilidad de imágenes, imágenes de rostros, modelos generativos, StyleGAN, edición en espacio latente