Clear Sky Science · zh

使用生成模型控制人脸图像的记忆度

· 返回目录

为什么有些面孔会在我们脑海中留下印象

我们每天在屏幕上滑过无数面孔,但只有少数会留下记忆。广告商、教师、艺术家,甚至执法部门都关心哪些图像会被人们记住,哪些会被遗忘。这项研究提出了一个引人注目的问题:我们是否可以刻意将一张面部照片调高使其更容易被记住,或调低使其更易被遗忘,同时仍然保持同一人的身份和自然外观?借助强大的图像生成器,作者表明答案在很大程度上是肯定的,记忆度可以以受控的方式被引导。

Figure 1. AI如何在保持自然逼真外观的同时,使人脸照片更易记或更不易记
Figure 1. AI如何在保持自然逼真外观的同时,使人脸照片更易记或更不易记

一种调整面孔记忆度的新方法

研究人员基于生成式人工智能的最新进展,尤其是可以从抽象数值编码生成高度真实人脸图像的系统StyleGAN。每个编码对应一张面孔。通过生成大量合成面孔并使用深度学习的“记忆度评估器”网络对每张图像的被记住概率进行评分,团队在这些隐藏编码与人类记忆之间建立了一张映射。然后他们使用一种简单的统计工具在这一隐藏空间中找到一条分界面,将更易记的面孔与不易记的面孔分开。将一张面孔的编码沿着穿越该分界面的一个方向移动会提高其预测记忆度,反方向移动则会降低它。

改变外观而不改变身份

为使该方法对真实照片有用,作者首先将一张真实图像“反演”到StyleGAN的隐藏空间,找到一个能够重建原始面孔的编码。一旦找到该编码,他们沿着记忆度方向对其进行微调并重新生成图像。生成的面孔依然属于同一人,但现在看起来更容易或更不易被记住。精心设计的测试表明,人们对身份的识别被保留,且图像的真实感与未编辑输出接近。团队还开发了更细化的多级方法,以多个小步长而非一次性跳变来调整记忆度;这种更柔和的控制能使身份保持得更稳定。

当一张面孔变得难忘时实际发生了什么变化

通过检查数千张被编辑的面孔,研究揭示了记忆度上升时倾向发生变化的视觉细节。更易记的面孔通常看起来略显年轻,面部轮廓更纤细,皮肤更明亮,妆容或面部毛发更明显,表情更严肃。研究人员测量了眼睛和嘴周围的局部图像属性,发现当记忆度增加时,眼部区域的对比度和嘴唇颜色的丰富度有小但可靠的提升。他们还排除了基于整体亮度的简单解释:与他们方法产生的更强、更局部化的编辑相比,单纯统一地调亮或调暗面孔几乎不会改变记忆度评分。

Figure 2. 沿着隐藏的视觉尺度滑动如何将一张面孔从容易被遗忘微妙地变为高度难忘
Figure 2. 沿着隐藏的视觉尺度滑动如何将一张面孔从容易被遗忘微妙地变为高度难忘

从人脸扩展到日常物体

该方法并不限于人物。作者将相同思路应用于由其他生成模型创建的猫、马、汽车和教堂等图像。同样,他们在隐藏编码空间中找到了可以提高或降低预测记忆度的方向。对于物体来说,可见的变化通常涉及放大主体、改变视角或修改背景与颜色,使主题更突出。这表明尽管面孔与物体的视觉线索不同,但基本原理相似:在可能的图像空间中存在一致的方向,使图像更容易或更难被记住。

受控记忆度为何重要

简单来说,论文表明记忆度不仅仅是图像的神秘副产品;它可以被有意调整。通过学习如何沿着微妙的视觉维度推动图像,计算机可以生成更容易或更不容易被我们记住的面孔和物体。这在教育中有潜在用途,例如可以调优图示以提高记忆,在传播与设计中也能将重要信息与更易在记忆中停留的图像配对。与此同时,作者强调需要伦理保障,因为同样的工具在使教育图像更有效的同时,也可能被用于以值得审慎监督的方式影响注意力与记忆。

引用: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

关键词: 图像可记忆性, 人脸图像, 生成模型, StyleGAN, 潜在空间编辑