Clear Sky Science · pl

Kontrolowanie zapamiętywalności zdjęć twarzy za pomocą modeli generatywnych

· Powrót do spisu

Dlaczego niektóre twarze zapadają nam w pamięć

Codziennie przewijamy mnóstwo twarzy na ekranach, lecz tylko nieliczne pozostają w pamięci. Reklamodawcy, nauczyciele, artyści, a nawet organy ścigania interesują się, które obrazy ludzie zapamiętują, a które zapominają. W tym badaniu pada prowokujące pytanie: czy można celowo zwiększyć zapamiętywalność zdjęcia twarzy lub ją zmniejszyć, zachowując jednocześnie tę samą osobę i naturalny wygląd? Korzystając z zaawansowanych generatorów obrazów, autorzy pokazują, że odpowiedź w dużej mierze brzmi „tak” i że zapamiętywalnością można sterować w kontrolowany sposób.

Figure 1. Jak AI może przesunąć zdjęcia twarzy w kierunku większej lub mniejszej zapamiętywalności, zachowując ich naturalny i realistyczny wygląd
Figure 1. Jak AI może przesunąć zdjęcia twarzy w kierunku większej lub mniejszej zapamiętywalności, zachowując ich naturalny i realistyczny wygląd

Nowy sposób regulowania, jak bardzo twarz zapada w pamięć

Badacze opierają się na ostatnich postępach w generatywnej sztucznej inteligencji, szczególnie na systemie o nazwie StyleGAN, który potrafi tworzyć wysoce realistyczne obrazy twarzy z abstrakcyjnych kodów liczbowych. Każdy kod odpowiada jednej twarzy. Generując dużą kolekcję syntetycznych twarzy i oceniając prawdopodobieństwo zapamiętania każdej z nich za pomocą sieci głębokiego uczenia „oceniających zapamiętywalność”, zespół tworzy mapę między tymi ukrytymi kodami a ludzką pamięcią. Następnie używają prostego narzędzia statystycznego, aby znaleźć powierzchnię dzielącą w tej ukrytej przestrzeni twarze bardziej zapamiętywalne od mniej zapamiętywalnych. Przesunięcie kodu twarzy w jednym kierunku względem tej powierzchni zwiększa przewidywaną zapamiętywalność, a w przeciwnym ją obniża.

Zmienianie wyglądu bez zmiany tożsamości

Aby uczynić metodę użyteczną dla rzeczywistych fotografii, autorzy najpierw „invertują” prawdziwe zdjęcie do ukrytej przestrzeni StyleGAN, znajdując kod, który odtwarza pierwotną twarz. Po znalezieniu tego kodu przesuwają go wzdłuż kierunku zapamiętywalności i ponownie generują obraz. Otrzymane twarze należą do tej samej osoby, ale wyglądają teraz na bardziej lub mniej zapadające w pamięć. Skrupulatne testy wykazują, że tożsamość osób jest zachowana, a realizm obrazów pozostaje zbliżony do nieedytowanych wyników. Zespół opracowuje też drobniejszą, wielopoziomową wersję metody, która reguluje zapamiętywalność w kilku małych krokach zamiast jednego skoku; takie łagodniejsze sterowanie jeszcze lepiej utrzymuje tożsamość.

Co właściwie się zmienia, gdy twarz staje się zapamiętywalna

Analizując tysiące edytowanych twarzy, badanie ujawnia, które cechy wizualne zwykle zmieniają się przy wzroście zapamiętywalności. Bardziej zapamiętywalne twarze często wyglądają nieco młodziej, mają szczuplejszą budowę twarzy, jaśniejszą skórę, wyraźniejszy makijaż lub owłosienie twarzy oraz bardziej poważne wyrazy. Badacze mierzą lokalne właściwości obrazu wokół oczu i ust, znajdując niewielkie, lecz wiarygodne wzrosty kontrastu w okolicach oczu i intensywności koloru warg przy zwiększonej zapamiętywalności. Wykluczają też prostą interpretację opartą na ogólnej jasności: równomierne rozjaśnianie lub przyciemnianie twarzy niemal nie zmienia wyników zapamiętywalności w porównaniu ze silniejszymi, bardziej lokalnymi poprawkami generowanymi przez ich metodę.

Figure 2. Jak przesuwanie się wzdłuż ukrytej skali wizualnej subtelnie zmienia twarz od łatwej do zapomnienia do wyraźnie zapadającej w pamięć
Figure 2. Jak przesuwanie się wzdłuż ukrytej skali wizualnej subtelnie zmienia twarz od łatwej do zapomnienia do wyraźnie zapadającej w pamięć

Od twarzy po przedmioty codziennego użytku

Podejście nie ogranicza się do ludzi. Autorzy stosują ten sam pomysł do obrazów kotów, koni, samochodów i kościołów wygenerowanych przez inne modele. Ponownie znajdują kierunek w przestrzeni ukrytej, który podnosi lub obniża przewidywaną zapamiętywalność. W przypadku obiektów widoczne zmiany często obejmują przybliżenie, zmianę punktu widzenia lub modyfikację tła i koloru w sposób, który sprawia, że temat wyróżnia się bardziej. Sugeruje to, że choć wskazówki wizualne różnią się między twarzami a przedmiotami, zasadnicza zasada jest podobna: istnieją spójne kierunki w przestrzeni możliwych obrazów, które czynią je bardziej lub mniej zapadającymi w pamięć.

Dlaczego kontrolowana zapamiętywalność ma znaczenie

Mówiąc wprost, artykuł pokazuje, że zapamiętywalność nie jest tylko tajemniczym ubocznym produktem obrazu; to coś, co można regulować z zamiarem. Ucząc się, jak przesuwać obrazy wzdłuż subtelnych wymiarów wizualnych, komputery mogą tworzyć twarze i przedmioty, które nasze umysły są bardziej lub mniej skłonne zapamiętać. Ma to zastosowania w edukacji, gdzie schematy czy ilustracje można dostroić dla lepszej pamięci, oraz w komunikacji i projektowaniu, gdzie ważne przekazy można łączyć z obrazami zaprojektowanymi tak, by utrzymywały się w pamięci. Jednocześnie autorzy podkreślają potrzebę etycznych zabezpieczeń, ponieważ te same narzędzia, które zwiększają skuteczność obrazów edukacyjnych, mogą też kształtować uwagę i pamięć w sposób wymagający ostrożnego nadzoru.

Cytowanie: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

Słowa kluczowe: zapamiętywalność obrazu, obrazy twarzy, modele generatywne, StyleGAN, edycja przestrzeni ukrytej