Clear Sky Science · ru

Контроль запоминаемости изображений лиц с помощью генеративных моделей

· Назад к списку

Почему некоторые лица остаются в памяти

Каждый день мы пролистываем бесчисленное количество лиц на экранах, но надолго запоминаются лишь немногие. Рекламодатели, преподаватели, художники и даже правоохранительные органы интересуются тем, какие изображения люди запоминают, а какие забывают. В этом исследовании поставлен неожиданный вопрос: можем ли мы намеренно сделать фотографию лица более запоминающейся или менее запоминающейся, при этом сохранив того же человека и естественный внешний вид? Авторы, используя мощные генераторы изображений, показывают, что ответ во многом положительный и что запоминаемость можно направленно регулировать.

Figure 1. Как ИИ может подтолкнуть фотографии лиц к большей или меньшей запоминаемости, сохраняя их естественность и реализм
Figure 1. Как ИИ может подтолкнуть фотографии лиц к большей или меньшей запоминаемости, сохраняя их естественность и реализм

Новый способ настраивать запоминаемость лица

Исследователи опираются на недавние достижения в генеративном искусственном интеллекте, особенно на систему под названием StyleGAN, которая способна создавать высокореалистичные изображения лиц из абстрактных числовых кодов. Каждому коду соответствует одно лицо. Сгенерировав большую коллекцию синтетических лиц и оценив вероятность запоминания каждого с помощью нейросетей—оценщиков «запоминаемости», команда создает карту между этими скрытыми кодами и человеческой памятью. Затем они используют простой статистический инструмент, чтобы найти разделяющую поверхность в этом скрытом пространстве, отделяющую более запоминающиеся лица от менее запоминающихся. Смещение кода лица в одном направлении через эту поверхность увеличивает предсказанную запоминаемость, а в другом — понижает её.

Менять внешний вид, не меняя личности

Чтобы сделать метод применимым к реальным фотографиям, авторы сначала «инвертируют» реальное изображение в скрытое пространство StyleGAN, находя код, который воссоздает исходное лицо. Как только этот код найден, его сдвигают вдоль направления запоминаемости и генерируют изображение снова. Получившиеся лица принадлежат тому же человеку, но теперь выглядят более или менее склонными к запоминанию. Тщательные тесты показывают, что идентичность людей сохраняется, а реализм изображений остаётся близким к оригинальным неотредактированным результатам. Команда также разрабатывает более тонкую, многоуровневую версию метода, которая регулирует запоминаемость несколькими малыми шагами вместо одного прыжка; такой мягкий контроль еще лучше сохраняет идентичность.

Что на самом деле меняется, когда лицо становится запоминающимся

Изучив тысячи отредактированных лиц, исследование выявляет визуальные детали, которые сдвигаются при росте запоминаемости. Более запоминающиеся лица часто выглядят чуть моложе, с более узкой структурой лица, более светлой кожей, более заметным макияжем или растительностью на лице и более серьезным выражением. Исследователи измеряют локальные свойства изображения вокруг глаз и рта и находят небольшие, но устойчивые увеличения контраста в области глаз и насыщенности цвета губ при повышении запоминаемости. Они также исключают простое объяснение на основе общей яркости: равномерное осветление или затемнение лиц едва изменяет оценки запоминаемости по сравнению с более сильными, локализованными изменениями, которые создает их метод.

Figure 2. Как скольжение по скрытой визуальной шкале тонко превращает одно лицо из легко забываемого в сильно запоминающееся
Figure 2. Как скольжение по скрытой визуальной шкале тонко превращает одно лицо из легко забываемого в сильно запоминающееся

Не только лица — и для повседневных объектов

Подход не ограничивается людьми. Авторы применяют ту же идею к изображениям кошек, лошадей, автомобилей и церквей, созданным другими генеративными моделями. И снова они находят направление в скрытом кодовом пространстве, которое повышает или понижает предсказанную запоминаемость. Для объектов видимые изменения часто включают приближение, сдвиг точки обзора или изменение фона и цвета так, чтобы субъект выделялся. Это указывает на то, что хотя визуальные подсказки различаются для лиц и объектов, лежащий в основе принцип схож: в пространстве возможных изображений существуют устойчивые направления, делающие их более или менее запоминающимися.

Зачем нужен контроль над запоминаемостью

Проще говоря, работа показывает: запоминаемость — не просто таинственный побочный эффект изображения; это свойство, которое можно целенаправленно регулировать. Научившись сдвигать изображения по тонким визуальным измерениям, компьютеры могут создавать лица и объекты, которые наш мозг с большей или меньшей вероятностью сохранит в памяти. Это находит потенциальные применения в образовании, где диаграммы или иллюстрации можно настроить для лучшего запоминания, а также в коммуникации и дизайне, где важные сообщения могут сопровождаться образами, призванными задержаться в памяти. В то же время авторы подчеркивают необходимость этических мер предосторожности, поскольку те же инструменты, которые делают образовательные изображения эффективнее, могут использоваться для управления вниманием и памятью в ситуациях, требующих тщательного контроля.

Цитирование: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

Ключевые слова: запоминаемость изображений, изображения лиц, генеративные модели, StyleGAN, редактирование латентного пространства