Clear Sky Science · ja

生成モデルで顔画像の記憶に残りやすさを制御する

· 一覧に戻る

なぜある顔は心に残るのか

私たちは毎日、画面で数え切れないほどの顔を目にしますが、記憶に残るのはごく一部です。広告業、教育、芸術、捜査など多くの分野が、どの画像が記憶され、どれが忘れられるかに関心を持ちます。本研究は挑発的な問いを投げかけます:同じ人物らしさと自然な外観を保ちながら、顔写真を意図的に記憶に残りやすくしたり、逆に目立たなくしたりできるのか。強力な画像生成器を用い、著者らは大筋で「できる」と示し、記憶性を制御可能であることを明らかにしました。

Figure 1. 自然でリアルな外観を保ちながら、AIが顔写真の記憶に残りやすさを高めたり下げたりできる仕組み
Figure 1. 自然でリアルな外観を保ちながら、AIが顔写真の記憶に残りやすさを高めたり下げたりできる仕組み

顔の記憶に残りやすさを調整する新手法

研究者たちは、特にStyleGANと呼ばれる、抽象的な数値コードから極めてリアルな顔画像を生成できる生成型AIの進展を基盤にしています。各コードは一つの顔に対応します。大量の合成顔を生成し、深層学習の“記憶性評価”ネットワークでそれぞれの記憶されやすさをスコア化することで、潜在コードと人間の記憶の間の対応地図を作成しました。次に単純な統計手法を用いて、この隠れ空間において記憶に残りやすい顔とそうでない顔を分ける境界面を見つけます。ある方向にコードを動かすと予測記憶性が上がり、逆方向に動かすと下がります。

誰なのかは変えずに見た目だけを変える

実写真に応用するため、著者らはまず実際の画像をStyleGANの潜在空間に「逆写像」し、元の顔を再現するコードを見つけます。このコードが得られたら、記憶性の方向に沿ってわずかに動かし、画像を再生成します。得られた顔は同一人物に属しつつ、記憶に残りやすさが高まったり低まったりします。慎重な実験により、人物の同一性は保持され、画像のリアリズムも編集前の出力とほぼ同等に保たれることが示されました。さらに著者らは、単発の大きな変更ではなく複数段階で記憶性を細かく調整する多段階バージョンも開発しており、より穏やかな操作で同一性の安定性を高めます。

顔が記憶に残りやすくなると実際に何が変わるか

数千の編集済み顔を検査することで、記憶性が上がる際にどのような視覚的詳細が変わりやすいかが明らかになりました。記憶に残りやすい顔は、やや若々しく見え、顔の輪郭がすっきりし、肌が明るく、化粧や顔毛が強調され、表情がより真剣に見えることが多いです。著者らは目元や口元周辺の局所的な画像特性を測定し、記憶性を上げると目の周囲のコントラストや唇の色の豊かさが小さいが一貫して増加することを見出しました。全体的な明るさによる単純な説明は否定されており、均一に明るくしたり暗くしたりするだけでは、著者らの方法が行うよりも強い局所的な編集に比べて記憶性スコアはほとんど変わりませんでした。

Figure 2. 隠れた視覚的尺度に沿って滑らせることで、忘れやすい顔から非常に記憶に残る顔へとわずかに変化させる方法
Figure 2. 隠れた視覚的尺度に沿って滑らせることで、忘れやすい顔から非常に記憶に残る顔へとわずかに変化させる方法

顔以外の日常物にも応用可能

この手法は人に限定されません。著者らは、猫、馬、自動車、教会といった他の生成モデルが作る物体画像にも同じ考え方を適用しました。ここでも、潜在コード空間に予測記憶性を上げ下げする方向が見つかりました。物体の場合、目に見える変化は被写体のズーム、視点の変更、背景や色の変更などで被写体を際立たせる傾向がありました。これは、顔と物体で視覚的手がかりは異なるものの、より記憶に残りやすくする方向が画像の可能な空間に一貫して存在するという基本原理が共通していることを示唆します。

制御された記憶性が重要な理由

簡潔に言えば、この論文は記憶性が単なる画像の奇妙な副産物ではなく、意図的に調整できるものであることを示しています。微妙な視覚次元に沿って画像を押し動かす方法を学ぶことで、コンピュータは私たちの心により残りやすい、あるいは残りにくい顔や物体を作れるようになります。これは、図やイラストを記憶しやすく調整できる教育分野や、重要なメッセージを記憶に残る画像と組み合わせるコミュニケーションやデザインの分野での応用が期待されます。一方で、同じ技術が注意や記憶を操作するために悪用される可能性があるため、著者らは倫理的な安全策の必要性を強調しています。

引用: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

キーワード: 画像の記憶性, 顔画像, 生成モデル, StyleGAN, 潜在空間編集