Clear Sky Science · fr

Ségrégation sémantique des nuages de points faciaux de Bouddha par croissance régionale guidée par le savoir

· Retour à l’index

Lire le visage de l’histoire

Les statues de Bouddha sculptées dans des falaises et les parois de temples sont plus que de belles œuvres d’art : ce sont des archives tridimensionnelles de croyances religieuses, de modes artistiques et d’échanges culturels à travers les siècles. Cette étude montre comment des informaticiens et des spécialistes du patrimoine peuvent « lire » ces visages de pierre en détail en séparant automatiquement les yeux, le nez, la bouche et les autres traits à partir de mesures 3D denses, même lorsqu’il n’existe aucun exemple étiqueté pour l’apprentissage. L’objectif est de transformer la pierre muette en données mesurables qui aident les historiens à comparer les styles, suivre les évolutions au fil du temps et planifier des opérations de conservation soigneuses.

Pourquoi les visages numériques comptent

Sur des sites célèbres comme Dunhuang, Yungang et Longmen, les visages de Bouddha varient subtilement selon les dynasties et les régions : certains sont plus pleins, d’autres plus effilés, certains avec des yeux plus doux ou des nez plus saillants. Traditionnellement, les historiens de l’art décrivent ces différences à l’œil ; aujourd’hui, des scans 3D de haute précision capturent la surface des statues sous forme de millions de points dans l’espace. Cependant, ces « nuages de points » sont désordonnés : ils n’ont ni couleur ni texture, et n’indiquent pas naturellement où s’arrête un œil et où commence une joue. Les méthodes automatiques existantes exigent soit de nombreux exemples manuellement étiquetés, qui font défaut pour les statues patrimoniales, soit segmentent les surfaces uniquement par la géométrie, en ignorant les règles sculpturales effectivement suivies par les artistes.

Figure 1
Figure 1.

Apprendre aux algorithmes les règles du visage

Plutôt que d’essayer d’apprendre à partir de données rares, les auteurs partent du savoir que les sculpteurs eux‑mêmes utilisaient. Les manuels bouddhistes traditionnels décrivent des proportions faciales standards, comme diviser le visage en trois parties égales pour front, nez et menton, et conserver la symétrie des traits autour d’un axe central. Les chercheurs traduisent ce savoir culturel et anatomique en règles géométriques simples : un plan de symétrie médian ; une ligne verticale passant par le centre du nez ; et des rapports reliant positions et tailles des yeux, du nez, de la bouche, des oreilles et du menton. Ces règles ne sont pas des gabarits rigides : elles comprennent des paramètres ajustables de sorte que les visages plus ronds de l’époque Tang comme les traits plus effilés de la période Song s’intègrent tous deux dans un cadre flexible mais reconnaissable.

Faire croître des régions à partir de graines

À partir d’un scan 3D nettoyé, la méthode aligne d’abord le visage de Bouddha pour qu’il regarde droit devant, puis projette la surface sur une grille carrée, transformant la forme 3D en quelque chose qui ressemble à une carte d’altitude ombrée. Dans cette grille, l’algorithme choisit des positions de « graines » de départ pour chaque élément facial, aidé par les règles préalables : la graine du nez se situe près de la ligne verticale centrale et d’un point local élevé, les yeux sont placés à des sommets symétriques de part et d’autre, la bouche se trouve sous le nez dans un creux peu marqué, etc. À partir de chaque graine, l’ordinateur « fait croître » une région vers l’extérieur, ajoutant des cellules voisines uniquement lorsque leur hauteur et leur pente correspondent à ce qu’on attendrait d’une arête nasale plutôt que d’une joue. Des étapes supplémentaires nettoient ensuite le résultat, en coupant les fragments errants, en comblant les petites lacunes et en lissant légèrement les contours afin que les yeux, les lèvres et le menton segmentés paraissent continus et plausibles tant pour l’ordinateur que pour un expert humain.

Mettre la méthode à l’épreuve

L’équipe a testé son approche sur quinze visages de Bouddha : neuf modèles synthétiques aux formes contrôlées et six scans réels provenant de sites patrimoniaux chinois renommés. Ils ont évalué la qualité en mesurant le recouvrement entre les régions segmentées automatiquement et des contours soigneusement dessinés à la main par des spécialistes, ainsi que la proximité des frontières calculées avec les contours experts. Pour les yeux, sourcils, oreilles, nez, bouche et menton, la méthode a obtenu des scores élevés, ce qui signifie que la plupart des points ont été correctement attribués à la bonne caractéristique. Fait important, les résultats se sont montrés stables face à différents styles de sculpture et niveaux d’usure de surface. Lorsqu’ils ont comparé leur approche à un modèle d’apprentissage profond populaire entraîné avec seulement quelques exemples étiquetés, le réseau avide de données a montré de grandes difficultés, tandis que la méthode guidée par le savoir est demeurée précise sans nécessiter de gros jeux d’entraînement.

Figure 2
Figure 2.

Ce que cela signifie pour le patrimoine

En encodant les règles de mesure traditionnelles des sculpteurs dans un algorithme moderne, cette étude montre que les ordinateurs peuvent segmenter les visages de Bouddha en 3D avec peu ou pas d’étiquetage manuel, tout en respectant la logique culturelle de l’œuvre d’origine. Pour les historiens, cela ouvre la voie à des comparaisons systématiques et quantitatives des styles faciaux entre sites et périodes ; pour les conservateurs, cela offre un moyen précis de surveiller les dégâts ou d’orienter la restauration numérique. En substance, la méthode transforme des conventions séculaires sur le visage idéal du Bouddha en un outil pratique pour lire, préserver et comprendre les visages de pierre qui veillent sur les temples et les grottes depuis plus d’un millénaire.

Citation: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Mots-clés: numérisation 3D de statues de Bouddha, numérisation du patrimoine culturel, segmentation de nuages de points, proportions faciales en art, algorithmes guidés par le savoir