Clear Sky Science · sv
En metod för 3D‑rekonstruktion av forntida byggnader driven av crowdsourcade bilder
Varför semesterfoton kan hjälpa till att rädda forntida byggnader
Runt om i världen nöts historiska tempel, torn och palats försiktigt bort av vind, regn, föroreningar och tid. Ingenjörer förlitar sig i dag på detaljerade 3D‑digitala modeller för att övervaka sprickor, mäta lutningar och planera noggranna reparationer. Men att skapa sådana modeller kräver ofta dyra lasrar, drönare och team på plats. Denna studie visar hur något mycket vanligare — mängder av turistfoton som publiceras online — kan omvandlas till högprecisa 3D‑rekonstruktioner av en berömd forntida träpagod, vilket minskar kostnader och risker samtidigt som den digitala dokumentationen av ett ömtåligt landmärke förbättras.
Utmaningen att förvandla vardagliga foton till solid vetenskap
Traditionella 3D‑mätverktyg, såsom markbaserade laserskannrar och kamerautrustade drönare, kan fånga byggnader i stor detalj men är kostsamma, begränsade av regler och ibland oförmögna att fånga komplexa strukturers alla delar. Crowdsourcade bilder är däremot rikliga, billiga och tagna från många vinklar. Problemet är att de är extremt ojämna: vissa är suddiga, överexponerade eller blockerade av turister och träd; andra är tagna med mycket olika kameror och objektiv. När dessa bilder av blandad kvalitet matas in i standardprogram för rekonstruktion förstärker fel i form och ytdetaljer varandra, vilket ger förvrängd geometri och grumliga texturer som är oacceptabla för seriös kulturarvsbevarande.

Ett smart filter för röriga verklighetsbilder
För att bryta den här cykeln utformade författarna ett trestegs ”smart filter” som rengör och organiserar tusentals onlinebilder innan någon 3D‑modellering påbörjas. Först tar ett automatiserat screeningsteg snabbt bort uppenbart oanvändbara foton: det kontrollerar att pagodan faktiskt syns i bild, att upplösningen är tillräckligt hög, att byggnaden inte till största delen är dold av hinder, och att delar av bilden inte är utfrätta av starkt solljus eller dolda i brus. Varje steg använder moderna bildigenkänningsverktyg, och processen avbryts så snart en bild misslyckas, vilket sparar avsevärd beräkningstid. De överlevande bilderna går sedan vidare till ett andra steg som hittar nästan identiska dubletter — bilder tagna med bara någon sekunds mellanrum — genom att jämföra både helhetsinnehåll och lokal struktur, och behåller endast de mest användbara versionerna.
Bedöma bildkvalitet utifrån hur byggnaden ”känns”
Även efter screening och deduplicering är inte varje foto lika användbart för att rekonstruera fina sniderier, lager på tak och åldrande träbjälkar. Därför poängsätter ramverket i ett tredje steg varje bild utifrån flera aspekter som är viktiga för 3D‑modellering: hur väl bilden bevarar skarpa kanter och konturer, hur mycket visuell information dess texturer förmedlar, hur brusig eller förvrängd den är, och hur väl dess färger stämmer överens med verkligheten. Istället för att förlita sig på ett enda mått blandar författarna fem olika kvalitetsindikatorer och använder statistik för att lära hur starkt var och en relaterar till fel i de slutliga modellerna. Detta ger ett balanserat ”betyg” som gynnar bilder som bevarar både korrekta former och rika, trovärdiga ytdetaljer.
Metoden testad på ett lutande trätorn
Teamet tillämpade sitt ramverk på Yingxian Wooden Pagoda i norra Kina, en hög, århundraden gammal träkonstruktion känd för sina invecklade konsolsystem och en svag men oroande lutning. De samlade två matchande bildserier: en bestående av crowdsourcade foton från 2015–2024 som kördes genom det nya filtrerings‑ och poängsättningsflödet, och en andra uppsättning noggrant tagna, högkvalitativa bilder från platsen som användes som en traditionell referens. Båda uppsättningarna matades sedan in i samma toppmoderna 3D‑rekonstruktionsmotor, vilket möjliggjorde en direkt jämförelse av de resulterande digitala modellerna, från punkttäthet till ytskärpa och färgnoggrannhet.

Skarpare virtuellt kulturarv från vardagsbilder
De crowdsourcade bilderna, när de väl hade rengjorts och optimerats, gjorde mer än att bara matcha de professionellt tagna bilderna — de överträffade dem ofta. Modellen byggd från de filtrerade onlinebilderna innehöll ungefär en fjärdedel fler punkter på byggnadens yta och i dess volym, samtidigt som brus och felaktiga punkter minskade märkbart. Kanterna på snidad plåt och konsolset framträdde klarare, och uppmätt texturskärpa förbättrades med nästan 30 procent. Färgdifferenser i förhållande till en fysisk referenstavla minskade med ungefär en tredjedel, vilket indikerar en närmare överensstämmelse med hur pagodan faktiskt ser ut. För kulturarvskonservatorer betyder detta att, med rätt digitala skydd, kan allmänhetens fotokollektioner leverera högfidelitets 3D‑modeller utan tung utrustning eller inträngande fältarbete.
Vad detta betyder för att skydda det förflutna
För icke‑specialister är huvudbudskapet enkelt: de foton människor tar och delar i förbifarten kan, om de filtreras och utvärderas på rätt sätt, bli kraftfulla verktyg för att bevara världens arkitektoniska skatter. Metoden i denna artikel visar hur man sorterar bra bilder från dåliga på ett sätt som respekterar både formerna och ytorna hos historiska byggnader, och producerar detaljerade, pålitliga 3D‑modeller från röriga verklighetsdata. När dessa tekniker sprids kan det bli möjligt att övervaka subtila förändringar i gamla strukturer över åratal med ingenting mer än noggrant kurerade crowdsourcade bilder, och förvandla vardagligt sevärdhetsfotograferande till en tyst kraft för kulturbevarande.
Citering: Liu, Y., Huo, L., Shen, W. et al. A method for 3D reconstruction of ancient buildings driven by crowdsourced images. npj Herit. Sci. 14, 81 (2026). https://doi.org/10.1038/s40494-026-02346-5
Nyckelord: 3D‑rekonstruktion, crowdsourcade bilder, kulturellt arv, forntida arkitektur, digital bevarande