Clear Sky Science · it

Rete di fusione di caratteristiche voxel multiscala per il completamento su larga scala di nuvole di punti rumorose nel restauro del patrimonio culturale

2026-02-12 · Torna all'indice

Riportare le strutture antiche a fuoco nel mondo digitale

Quando gli storici scansionano templi o monumenti storici con i laser, i dati 3D risultanti spesso assomigliano più al “neve” di una televisione che a un’immagine nitida. Parti di tetti o sculture mancano, e punti casuali “fantasma” affollano la scena. Questo articolo presenta un nuovo metodo di intelligenza artificiale (IA) che pulisce e completa queste nuvole di punti 3D, aiutando curatori e ricercatori a vedere siti di patrimonio culturale complessi — come antichi santuari giapponesi — con molta maggiore chiarezza.

Perché le scansioni 3D dei siti del patrimonio sono così disordinate

Strumenti moderni come LiDAR e telecamere di profondità possono catturare milioni di punti 3D di edifici e paesaggi in pochi minuti. Ma alberi, ombre, angoli di ripresa sfavorevoli e i limiti stessi degli scanner fanno sì che alcune aree non vengano mai “viste”, mentre altre risultano corrotte dal rumore. In pratica, ciò porta a nuvole di punti a chiazze e irregolari dove caratteristiche chiave — come travi del tetto incastrate o cornici elaborate — sono o mancanti o sepolte sotto punti spurii. Le tecniche di riparazione digitale precedenti riempivano i vuoti in modo rozzo, sfocavano i dettagli fini o richiedevano calcoli intensivi che non si adattavano a scene esterne di grandi dimensioni.

Una pipeline di restauro digitale in tre fasi

Gli autori si basano sul lavoro precedente e propongono un framework IA in tre stadi pensato per scansioni 3D grandi e rumorose di patrimoni culturali. La prima fase è un filtraggio multistadio: l’algoritmo applica inizialmente un test statistico per rimuovere outlier evidenti, quindi usa un filtro guidato che osserva patch locali di superficie per smussare il rumore residuo preservando forme nette come gli spigoli. In secondo luogo, i punti puliti vengono convertiti in “voxel” 3D — piccoli cubi — e analizzati contemporaneamente a più risoluzioni. Griglie grossolane catturano la struttura complessiva di un tetto; griglie più fini catturano creste, tegole e bordi. Queste caratteristiche voxel multiscala sono poi fuse con meccanismi di attenzione che permettono alla rete di decidere quanto fidarsi di ciascuna scala in diverse regioni dell’oggetto.

Affilare i bordi e riempire i vuoti

Nella terza fase, le caratteristiche fuse passano attraverso un modulo basato su Transformer che predice uno “scheletro” sparso di punti chiave rappresentanti le regioni mancanti. Un passaggio speciale di potenziamento guidato dalla curvatura misura quanto ciascuna regione si piega e usa questa informazione per regolare le caratteristiche, in modo che lo scheletro previsto segua meglio i veri spigoli e angoli invece di arrotondarli. Infine, un modulo di upsampling espande questo scheletro in una nuvola di punti densa e completata che mira a corrispondere alla superficie reale mantenendo una distribuzione uniforme dei punti, evitando ammassi o buchi che distraggano gli osservatori o fuorviino gli analisti.

Quanto funziona bene nella pratica?

Il team ha testato il proprio approccio sia su forme sintetiche sia su scansioni reali. Su un benchmark standard di modelli 3D (ShapeNet‑55), il loro metodo ha recuperato le parti mancanti con maggiore precisione rispetto a diverse reti di riferimento, migliorando una misura chiave di distanza fino a circa il 16 percento mantenendo alta la completezza. Più importante per le applicazioni sul patrimonio, hanno assemblato un dataset di tetti di templi giapponesi derivato da scansioni laser reali che includono rumore del mondo reale. Qui il metodo ha chiaramente superato le alternative, specialmente quando i dati erano fortemente contaminati. Nei confronti visivi, la pipeline proposta ha prodotto tegole più nette, cornici più fedeli e meno artefatti. Applicata alla scansione su larga scala del santuario Tamaki‑jinja — oltre 25 milioni di punti — è stata in grado di ricostruire sezioni di tetto mancanti e affinare superfici rumorose entro un budget pratico di tempo e memoria.

Vedere attraverso le superfici con dati più chiari

I ricercatori hanno anche integrato il loro metodo di completamento con una tecnica di visualizzazione trasparente sviluppata in precedenza, che permette agli osservatori di “vedere attraverso” le superfici esterne di nuvole di punti dense per osservare le strutture interne. Sui dati rumorosi originali, le viste trasparenti dei tetti di Tamaki‑jinja erano confuse: gap, punti erranti e regioni mancanti oscuravano la struttura reale. Dopo l’applicazione del nuovo framework di completamento, le stesse viste mostravano contorni dei tetti e delle cornici molto più nitidi, facilitando l’interpretazione di come è assemblato l’edificio. Sebbene il metodo fatichi ancora in aree dove le scansioni sono estremamente incomplete o sovrastate dal rumore, migliora sostanzialmente sia la precisione geometrica sia la leggibilità visiva nella maggior parte delle regioni.

Cosa significa per il patrimonio culturale

In termini semplici, questo lavoro fornisce un “restauratore digitale” più intelligente per le scansioni 3D di siti storici. Pulendo attentamente i dati, comprendendo le forme a più scale e prestando particolare attenzione a spigoli e curve, il metodo può ricostruire plausibilmente parti mancanti degli edifici evitando risultati eccessivamente levigati o distorti. Per curatori, architetti e storici, ciò significa modelli virtuali più affidabili per studio, pianificazione della conservazione ed esposizioni pubbliche, comprese viste immersive “see‑through” di complessi telai lignei. Pur non sostituendo la conservazione fisica, offre uno strumento potente per preservare ed esplorare la geometria del fragile patrimonio culturale nel dominio digitale.

Citazione: Li, W., Pan, J., Hasegawa, K. et al. Multiscale voxel feature fusion network for large scale noisy point cloud completion in cultural heritage restoration. npj Herit. Sci. 14, 93 (2026). https://doi.org/10.1038/s40494-026-02331-y

Parole chiave: nuvola di punti 3D, patrimonio culturale, rilievo LiDAR, deep learning, restauro digitale