Clear Sky Science · it

InSwAV: clustering delle feature potenziata da involution e assegnazioni scambiate per la classificazione microscopica di reperti in porcellana

· Torna all'indice

Perché la porcellana rotta conta nel presente

In Cina e oltre, gli scavi archeologici portano alla luce montagne di frammenti di porcellana. Ogni scheggia conserva indizi su come vivevano le persone, su come commerciavano e su come padroneggiavano le cotture ad alta temperatura secoli fa. Tuttavia separare e ricomporre questi innumerevoli cocci è un lavoro lento che richiede competenze specialistiche. Questo studio presenta un nuovo approccio di intelligenza artificiale, chiamato InSwAV, che impara dalle immagini microscopiche delle superfici in porcellana per raggruppare automaticamente i frammenti per tipologia. Una classificazione più rapida e affidabile potrebbe accelerare notevolmente i lavori di restauro e approfondire la nostra comprensione del patrimonio culturale.

Figure 1
Figure 1.

Vedere la storia nelle bolle minuscole

Ad occhio nudo molti pezzi di porcellana sembrano confusamente simili: smalti bianchi o verde pallido, motivi consumati e bordi danneggiati. Al microscopio, però, emerge un altro mondo. Piccole bolle intrappolate nello smalto registrano dettagli sull’argilla, sulla ricetta dello smalto, sulla temperatura di cottura e persino sulle abitudini di singoli forni o botteghe. Ricerche precedenti hanno mostrato che dimensione, forma e distribuzione di queste bolle variano fra centri produttivi e periodi storici, rendendole impronte robuste per identificazione e datazione. Ma estrarre e interpretare questi schemi sottili a mano o con strumenti tradizionali di elaborazione delle immagini è laborioso e sensibile al rumore.

Lasciare che il computer si insegni da sé

Un ostacolo importante in questo campo è la scarsità di dati etichettati: gli specialisti possono annotare solo un numero limitato di immagini microscopiche e alcuni tipi di frammento sono rari. Invece di dipendere da migliaia di esempi etichettati dagli esperti, gli autori ricorrono all’apprendimento self-supervised, in cui una rete neurale viene addestrata a scoprire strutture nei dati autonomamente. Hanno costruito il dataset Porcelain Relic Microscopic Image (PRMI), contenente 7425 immagini a elevata ingrandimento appartenenti a cinque categorie di porcellana. Per ogni micrografia originale il sistema crea più versioni alterate ritagliando, ribaltando, modificando leggermente i colori e sfocando. Queste “visioni” mostrano lo stesso materiale in modi diversi, incoraggiando il computer a concentrarsi su caratteristiche stabili e significative piuttosto che su dettagli superficiali.

Figure 2
Figure 2.

Un modo più intelligente per riconoscere i pattern

Il cuore del metodo è InSwAV, una rete costruita attorno a un estrattore di feature personalizzato chiamato ResInv. Le reti standard per immagini usano filtri convoluzionali fissi che scorrono sull’immagine. ResInv invece combina questi con operazioni di “involution” che adattano il loro comportamento in funzione della posizione, catturando meglio le forme irregolari e multi-scala delle bolle dello smalto e delle crepe. Una volta che ResInv trasforma ogni immagine in una firma compatta, InSwAV non confronta direttamente singole immagini. Le assegna piuttosto a un insieme di “prototipi” appresi, o centri di cluster, e poi verifica se le diverse viste aumentate dello stesso frammento ricadono in cluster compatibili. Un passaggio matematico di bilanciamento evita che il modello si limiti a spostare tutto in pochi gruppi, costringendolo a scoprire strutture reali e più fini.

Accuratezza, velocità e cosa rivelano

Sul dataset PRMI, InSwAV distingue correttamente le cinque categorie di porcellana nel 96,2% dei casi, superando nettamente diversi metodi self-supervised di punta e persino un solido modello supervisionato che aveva accesso alle etichette. Si addestra inoltre molto più rapidamente, raggiungendo alte accuratezze dopo poche ore su hardware grafico moderno. Visualizzazioni dell’attività interna della rete mostrano che ResInv si concentra sulle bolle e sui dettagli microstrutturali chiave, mentre un’architettura standard tende a farsi distrarre dalle regioni di sfondo. L’approccio è anche robusto rispetto a diverse scelte del numero di cluster, suggerendo che può adattarsi bene a nuovi insiemi di dati.

Cosa significa per i vasi rotti e oltre

In termini semplici, lo studio dimostra che un computer può imparare a distinguere diversi reperti in porcellana studiando i loro “paesaggi a bolle” microscopici, anche quando gli esperti forniscono poche etichette. Questa capacità potrebbe aiutare musei e archeologi a smistare grandi collezioni più rapidamente, a trovare corrispondenze per la ricomposizione virtuale dei frammenti e a supportare studi sulla tecnologia dei forni e sulle reti di scambio. Gli autori prevedono di ampliare il dataset, testare il metodo su raccolte di immagini più ampie e rendere il modello ancora più snello per l’uso sul campo. Man mano che questi strumenti matureranno, promettono di trasformare fragili schegge da rompicapi dispendiosi in termini di tempo in ricche e rapidamente accessibili registrazioni del passato.

Citazione: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Parole chiave: reperti in porcellana, imaging microscopico, apprendimento self-supervised, restauro del patrimonio culturale, classificazione delle immagini