Clear Sky Science · fr

Un ensemble de visages 3D à topologie standardisée avec diversité d’émotions et d’unités d’action pour les Asiatiques de l’Est

2026-03-24 · Retour à l’index

Pourquoi les visages numériques comptent

Des appels vidéo à la réalité virtuelle, notre quotidien est rempli de visages numériques. Pourtant, beaucoup des systèmes informatiques qui génèrent ces visages sont entraînés sur des données limitées, souvent axées sur des populations occidentales et un éventail restreint d’expressions. Cet article présente AST-Face, un nouveau jeu de données 3D centré sur de jeunes adultes d’Asie de l’Est, conçu pour fournir aux chercheurs de meilleures bases pour l’animation, l’étude des émotions et l’interaction homme‑machine.

Figure 1. De nombreux visages 3D d’Asie de l’Est sont unifiés dans une structure commune afin que les ordinateurs puissent comparer les expressions de manière équitable.

Ce que contient la nouvelle collection de visages

Le jeu de données AST-Face comprend des scans 3D détaillés de 98 participants d’Asie de l’Est âgés de 18 à 30 ans. Pour chaque personne, l’équipe a capturé un visage neutre, six émotions courantes (joie, colère, tristesse, surprise, peur et dégoût) et neuf mouvements faciaux spécifiques basés sur la musculature. Ces mouvements suivent un système bien connu qui décompose les expressions en petites unités d’action, comme relever les sourcils internes ou tirer les coins de la bouche. Un sous‑ensemble de volontaires a également autorisé des photos en couleur synchronisées depuis trois angles de caméra, créant une ressource plus riche pour les études qui combinent la forme 3D et les images classiques.

Comment les visages ont été capturés et nettoyés

Pour rendre les données fiables et comparables, les chercheurs ont construit un dispositif d’acquisition soigneusement contrôlé. Un scanner 3D haute précision a enregistré les détails fins de chaque visage tandis que trois caméras couleur filmaient depuis la gauche, le centre et la droite. Un éclairage réglable a réduit ombres et reflets, et un dispositif de positionnement a aidé les participants à maintenir une pose stable. Tous ont suivi le même protocole d’enregistrement : d’abord un visage neutre détendu, puis les six émotions, et enfin les neuf unités d’action, chacune guidée par du personnel formé. Ensuite, les scans bruts ont été nettoyés en retranchant l’arrière‑plan et la zone du cou, en alignant la pose de la tête, en corrigeant les propriétés de surface et en extrayant 84 points de repère standard sur chaque visage.

Figure 2. Un visage 3D grossier est progressivement affiné en un maillage partagé et lisse qui conserve les détails d’expression tout en harmonisant la structure.

Rendre chaque visage comparable

Un défi central en recherche sur les visages 3D est que les scans bruts n’ont pas la même structure numérique. Ils peuvent différer par le nombre de points et par la façon dont ces points sont connectés, ce qui rend difficile la comparaison d’un sourire d’une personne à une autre. AST-Face répond à ce problème en soumettant chaque scan à un processus d’alignement en deux étapes. D’abord, un modèle de visage flexible est ajusté pour capturer les grands mouvements comme la bouche ouverte ou les sourcils relevés. Ensuite, un algorithme de correspondance avancé déforme délicatement un maillage modèle partagé afin que tous les visages finaux aient un nombre de points et une connectivité identiques. Cette structure unifiée permet aux chercheurs de comparer les visages point par point entre individus et expressions sans devoir concevoir leur propre pipeline de prétraitement complexe.

À quoi servent les données

Le jeu de données final offre plusieurs couches d’information : des maillages 3D standardisés, des points de repère, des cartes détaillant comment chaque expression diffère du visage neutre, et des étiquettes vérifiées pour chaque émotion et unité d’action. Les fichiers publiquement disponibles excluent toute texture identifiable, tandis que les scans bruts et les images couleur sont accessibles sous accord d’utilisation des données pour protéger la vie privée des participants. Avec cette structure, AST-Face peut soutenir un large éventail de travaux, de l’animation faciale plus naturelle pilotée par des contrôles de type musculaire, aux modèles d’apprentissage automatique qui étudient la variation des expressions entre individus, en passant par des systèmes multimodaux reliant la forme 3D et l’imagerie 2D.

Ce que cela signifie pour les visages numériques futurs

En termes simples, AST-Face fournit aux chercheurs un ensemble de visages 3D d’Asie de l’Est de haute qualité et bien organisé, qui parlent tous le même langage numérique. En combinant des expressions variées, des étiquettes musculaires soigneusement vérifiées et une structure de maillage partagée, le jeu de données facilite la conception et l’évaluation d’algorithmes nécessitant des mouvements faciaux cohérents et réalistes. Bien qu’il se concentre sur un groupe d’âge spécifique et des expressions posées sous éclairage contrôlé, il contribue à réduire les lacunes démographiques dans les ressources existantes et jette des bases plus claires pour des visages numériques plus inclusifs et plus précis à l’avenir.

Citation: Zhao, Y., Gong, G., Li, Y. et al. A Topology Standardized 3D Facial Dataset with Emotion and Action Unit Diversity for East Asians. Sci Data 13, 735 (2026). https://doi.org/10.1038/s41597-026-07098-2

Mots-clés: jeu de données faciales 3D, expression faciale, visages d’Asie de l’Est, unités d’action, standardisation de la topologie