Clear Sky Science · fr

Une méthode de reconstruction 3D de bâtiments anciens fondée sur des images crowdsourcées

· Retour à l’index

Pourquoi les photos de vacances peuvent aider à sauver des bâtiments anciens

Partout dans le monde, temples historiques, tours et palais s’usent silencieusement sous l’effet du vent, de la pluie, de la pollution et du temps. Les ingénieurs s’appuient désormais sur des modèles numériques 3D détaillés pour surveiller les fissures, mesurer les inclinaisons et planifier des réparations précises. Mais la réalisation de ces modèles exige généralement des lasers coûteux, des drones et des équipes sur site. Cette étude montre comment quelque chose de beaucoup plus ordinaire — des foules de photos de touristes publiées en ligne — peut être transformé en reconstructions 3D très précises d’une pagode en bois ancienne célèbre, réduisant les coûts et les risques tout en améliorant l’archive numérique d’un monument fragile.

Le défi de transformer des photos occasionnelles en science rigoureuse

Les outils traditionnels d’arpentage 3D, comme les scanners laser terrestres et les drones équipés de caméras, permettent de capturer les bâtiments avec un grand niveau de détail, mais ils sont coûteux, soumis à des réglementations et parfois incapables de saisir certaines parties de structures complexes. Les images crowdsourcées, par contraste, sont abondantes, peu coûteuses et prises depuis de nombreux angles. L’inconvénient est qu’elles sont très hétérogènes : certaines sont floues, surexposées ou obstruées par des touristes et des arbres ; d’autres proviennent d’appareils et d’objectifs très différents. Lorsqu’on alimente ces photos de qualité mixte dans des logiciels de reconstruction standard, les erreurs de forme et de texture se renforcent mutuellement, produisant une géométrie déformée et des textures boueuses inacceptables pour la conservation du patrimoine.

Figure 1
Figure 1.

Un filtre intelligent pour des images réelles et désordonnées

Pour rompre ce cercle vicieux, les auteurs ont conçu un « filtre intelligent » en trois étapes qui nettoie et organise des milliers d’images en ligne avant toute modélisation 3D. D’abord, une phase de sélection automatisée élimine rapidement les photos manifestement inutiles : elle vérifie que la pagode apparaît bien dans le cadre, que la résolution est suffisante, que le bâtiment n’est pas majoritairement caché par des obstacles, et que des zones de l’image ne sont pas cramées par le soleil ou noyées dans le bruit. Chaque étape s’appuie sur des outils modernes de reconnaissance d’image, et le processus s’arrête dès qu’une photo échoue, ce qui économise un temps de calcul considérable. Les images retenues passent ensuite à une deuxième étape qui repère les quasi‑doublons — des clichés presque identiques pris à un instant d’intervalle — en comparant à la fois le contenu global et la structure locale, ne conservant que les versions les plus utiles.

Évaluer la qualité d’une image comme le ressent le bâtiment

Même après le tri et la déduplication, chaque photo n’est pas également utile pour reconstruire des sculptures fines, des toitures superposées et des poutres de bois vieillissantes. La troisième étape du cadre attribue donc à chaque image une note selon plusieurs aspects importants pour la modélisation 3D : la conservation des arêtes et des contours, la quantité d’information visuelle portée par les textures, le niveau de bruit ou de distorsion, et la fidélité des couleurs par rapport à la réalité. Plutôt que de s’appuyer sur une seule mesure, les auteurs combinent cinq indicateurs de qualité différents et utilisent des méthodes statistiques pour apprendre dans quelle mesure chacun est lié aux erreurs des modèles finaux. Cela produit une « fiche » équilibrée qui privilégie les images préservant à la fois des formes précises et des surfaces riches et crédibles.

Tester la méthode sur une tour en bois qui penche

L’équipe a appliqué son cadre à la pagode en bois de Yingxian, dans le nord de la Chine, une structure monumentale vieille de plusieurs siècles, connue pour ses systèmes d’échoppes complexes et une légère mais préoccupante inclinaison. Ils ont rassemblé deux jeux d’images correspondants : l’un composé de photos crowdsourcées de 2015 à 2024 passées par le nouveau pipeline de filtrage et de notation, et un second constitué de photographies sur site soigneusement prises et de haute qualité, utilisées comme référence traditionnelle. Les deux jeux ont ensuite été traités par le même moteur de reconstruction 3D de pointe, permettant une comparaison directe des modèles numériques obtenus, de la densité du nuage de points à la netteté des surfaces et à la fidélité des couleurs.

Figure 2
Figure 2.

Un patrimoine virtuel plus net à partir d’images du quotidien

Les images crowdsourcées, une fois nettoyées et optimisées, n’ont pas seulement égalé les photos professionnelles — elles les ont souvent surpassées. Le modèle construit à partir des images en ligne filtrées contenait environ un quart de points en plus sur la surface et dans le volume du bâtiment, tandis que le bruit et les points parasites étaient visiblement réduits. Les arêtes des plaques sculptées et des ensembles de consoles apparaissaient plus nettes, et la netteté des textures mesurée s’est améliorée de près de 30 %. Les différences de couleur par rapport à une charte de référence physique ont diminué d’environ un tiers, indiquant une correspondance plus proche de l’apparence réelle de la pagode. Pour les conservateurs du patrimoine, cela signifie qu’avec les garde‑fous numériques appropriés, les collections de photos publiques peuvent fournir des modèles 3D haute fidélité sans équipements lourds ni travail de terrain intrusif.

Ce que cela implique pour la protection du passé

Pour le grand public, le message clé est simple : les photos prises et partagées de façon informelle peuvent, si elles sont correctement filtrées et évaluées, devenir des outils puissants pour préserver les trésors architecturaux du monde. La méthode présentée dans cet article montre comment trier les bonnes images des mauvaises d’une manière qui respecte à la fois les formes et les surfaces des bâtiments historiques, produisant des modèles 3D détaillés et fiables à partir de données réelles et désordonnées. À mesure que ces techniques se répandent, il pourrait devenir possible de surveiller les changements subtils des anciennes structures sur plusieurs années en n’utilisant rien d’autre que des images crowdsourcées soigneusement sélectionnées, transformant ainsi le tourisme quotidien en une force discrète pour la conservation culturelle.

Citation: Liu, Y., Huo, L., Shen, W. et al. A method for 3D reconstruction of ancient buildings driven by crowdsourced images. npj Herit. Sci. 14, 81 (2026). https://doi.org/10.1038/s40494-026-02346-5

Mots-clés: reconstruction 3D, images crowdsourcées, patrimoine culturel, architecture ancienne, préservation numérique