Clear Sky Science · sv

En topologistad 3D-datamängd för ansikten med känslo- och action unit-mångfald för östasiater

2026-03-24 · Tillbaka till index

Varför digitala ansikten spelar roll

Från videosamtal till virtuell verklighet är våra liv fyllda av digitala ansikten. Många av de datorsystem som ligger bakom dessa ansikten tränas dock på begränsade data, ofta med fokus på västerländska populationer och ett smalt spektrum av uttryck. Denna artikel introducerar AST-Face, en ny 3D-datamängd med inriktning på unga östasiatiska vuxna som syftar till att ge forskare bättre byggstenar för animation, känsloforskning och människa–datorinteraktion.

Figure 1. Många östasiatiska 3D-ansikten förenas i en gemensam struktur så att datorer kan jämföra uttryck rättvist.

Vad den nya ansiktssamlingen innehåller

AST-Face-datamängden innehåller detaljerade 3D-skanningar från 98 östasiatiska deltagare mellan 18 och 30 år. För varje person fångade teamet ett neutralt ansikte, sex vanliga känslor (glädje, ilska, sorg, förvåning, rädsla och äckel) och nio specifika muskelbaserade ansiktsrörelser. Dessa rörelser följer ett välkänt system som bryter ner uttryck i små action units, till exempel att lyfta de inre ögonbrynen eller dra i mungiporna. En del av volontärerna tillät också synkroniserade färgbilder från tre kameravinklar, vilket skapar en rikare resurs för studier som kombinerar 3D-form med vanliga bilder.

Hur ansiktena fångades och rensades

För att göra data tillförlitlig och jämförbar byggde forskarna en noggrant kontrollerad inspelningsuppställning. En högprecisions 3D-skanner registrerade fina detaljer i varje ansikte medan tre färgkameror filmade från vänster, mitten och höger. Justerbar belysning minskade skuggor och blänk, och en positioneringsanordning hjälpte deltagarna att hålla en stadig pose. Alla följde samma inspelningsmanus: först ett avslappnat neutralt ansikte, sedan de sex känslorna och slutligen de nio action units, var och en guidad av tränad personal. Därefter rengjordes råskanningarna genom att ta bort bakgrund och nackområden, justera huvudets pose, korrigera ytegenskaper och extrahera 84 standardiserade landmärken på varje ansikte.

Figure 2. En grov 3D-ansikte förfinas gradvis till ett jämnt delat nät som bevarar uttrycksdetaljer samtidigt som strukturen matchas.

Göra varje ansikte jämförbart

En central utmaning inom 3D-ansiktsforskning är att råskanningar inte delar samma digitala struktur. De kan skilja sig i hur många punkter de innehåller och hur dessa punkter är kopplade, vilket försvårar att jämföra en persons leende med en annans. AST-Face tacklar detta genom att köra varje skanning genom en tvåstegs justeringsprocess. Först anpassas en flexibel ansiktsmodell för att fånga stora rörelser som öppna munnar och upphöjda ögonbryn. Sedan deformeras en avancerad matchningsalgoritm försiktigt ett delat mallnät så att alla slutliga ansikten får identiska antals punkter och kopplingar. Denna enhetliga struktur låter forskare jämföra ansikten punkt för punkt över personer och uttryck utan att behöva skapa egna komplexa förbehandlingspipelines.

Vad datan kan användas till

Den färdiga datamängden erbjuder flera informationslager: standardiserade 3D-meshar, landmärken, detaljerade kartor över hur varje uttryck skiljer sig från det neutrala ansiktet samt verifierade etiketter för varje känsla och action unit. Publikt tillgängliga filer utesluter identifierbara texturer, medan råskanningar och färgbilder ligger bakom ett användaravtal för att skydda deltagarnas integritet. Med denna struktur kan AST-Face stödja ett brett spektrum arbete, från mer naturlig ansiktsanimation styrd av muskel-liknande kontroller, till maskininlärningsmodeller som studerar hur uttryck varierar mellan individer, och till korsmodal system som länkar 3D-form och 2D-bilder.

Vad detta betyder för framtida digitala ansikten

Enkelt uttryckt ger AST-Face forskare en högkvalitativ, välorganiserad uppsättning östasiatiska 3D-ansikten som alla talar samma digitala språk. Genom att kombinera varierade uttryck, noggrant kontrollerade muskelbaserade etiketter och en delad meshstruktur gör datamängden det enklare att bygga och testa algoritmer som behöver konsekventa, realistiska ansiktsrörelser. Även om den fokuserar på en specifik åldersgrupp och poserade uttryck under kontrollerad belysning, hjälper den till att minska demografiska luckor i befintliga resurser och lägger en tydligare grund för mer inkluderande och precisa digitala ansikten i framtiden.

Citering: Zhao, Y., Gong, G., Li, Y. et al. A Topology Standardized 3D Facial Dataset with Emotion and Action Unit Diversity for East Asians. Sci Data 13, 735 (2026). https://doi.org/10.1038/s41597-026-07098-2

Nyckelord: 3D-datamängd för ansikten, ansiktsuttryck, östasiatiska ansikten, action units, topologistandardisering