Clear Sky Science · sv

InSwAV: involutionsförstärkt funktionsklustring och utbytta tilldelningar för mikroskopisk bildklassificering av porslinsartefakter

· Tillbaka till index

Varför krossat porslin spelar roll i nutiden

I Kina och långt utanför dess gränser gräver arkeologiska utgrävningar fram berg av splittrat porslin. Varje fragment bär ledtrådar om hur människor levde, handlade och bemästrade högtemperaturbränning för sekler sedan. Att sortera och matcha dessa otaliga skärvor är dock ett tidskrävande arbete som kräver experter. Denna studie presenterar ett nytt artificiellt intelligensförfarande, kallat InSwAV, som lär sig från mikroskopiska bilder av porslinsytor för att automatiskt gruppera fragment efter typ. Snabbare och mer tillförlitlig klassificering kan dramatiskt påskynda restaureringsarbete och fördjupa vår förståelse av kulturarvet.

Figure 1
Figure 1.

Att se historia i pyttesmå bubblor

För blotta ögat kan många porslinsföremål se förvillande lika ut: vita eller blekgröna glasyrer, utslitna mönster och skadade kanter. Under mikroskopet framträder dock en annan värld. Små bubblor infångade i glasyren registrerar detaljer om leran, glasyrreceptet, bränntemperaturen och till och med vanorna hos enskilda ugnar eller verkstäder. Tidigare forskning har visat att bubblornas storlek, form och fördelning varierar mellan produktionscentra och tidsperioder, vilket gör dem till kraftfulla fingeravtryck för identifiering och datering. Men att extrahera och tolka dessa subtila mönster för hand eller med traditionella bildbehandlingsverktyg är arbetsintensivt och känsligt för brus.

Låta datorn lära sig själv

Ett stort hinder inom detta område är bristen på märkta data: specialister kan bara annotera ett begränsat antal mikroskopbilder, och vissa fragmenttyper är sällsynta. Istället för att förlita sig på tusentals expertmärkta exempel vänder sig författarna till självövervakad inlärning, där ett neuralt nätverk tränas för att själv upptäcka struktur i data. De bygger datasetet Porcelain Relic Microscopic Image (PRMI), som innehåller 7425 högförstoringsbilder från fem porslinskategorier. För varje originalmikrograf skapar systemet flera förändrade versioner genom beskärning, spegling, små färgändringar och oskärpa. Dessa ”vy­er” visar samma material på olika sätt och uppmuntrar datorn att fokusera på stabila, meningsfulla egenskaper i stället för ytliga detaljer.

Figure 2
Figure 2.

Ett smartare sätt att upptäcka mönster

Kärnan i metoden är InSwAV, ett nätverk byggt kring en specialanpassad funktionsextraktor kallad ResInv. Vanliga bildnätverk använder fasta konvolutionsfilter som sveper över bilden. ResInv blandar i stället in ”involution”-operationer som anpassar sitt beteende beroende på position, vilket bättre fångar de oregelbundna, mångskaliga formerna hos glasyrbubblor och sprickor. När ResInv har omvandlat varje bild till en kompakt signatur jämför InSwAV inte enskilda bilder direkt. I stället tilldelar det dem till en uppsättning inlärda ”prototyper”, eller klustercentra, och kontrollerar sedan om olika förstärkta vyer av samma fragment hamnar i kompatibla kluster. Ett matematisk balanseringssteg förhindrar modellen från att lättsinnigt dumpa allt i bara ett fåtal grupper och tvingar den att upptäcka verklig, finare strukturer.

Noggrannhet, hastighet och vad de avslöjar

På PRMI-datasetet särskiljer InSwAV de fem porslinskategorierna korrekt 96,2 % av gångerna, klart bättre än flera ledande självövervakade metoder och till och med en stark övervakad referensmetod som hade tillgång till etiketter. Den tränar också mycket snabbare och når hög noggrannhet efter bara några timmar på modern grafikmaskinvara. Visualiseringar av nätverkets interna aktivitet visar att ResInv koncentrerar sig på bubblorna och viktiga mikrostrukturella detaljer, medan en standardarkitektur tenderar att distraheras av bakgrundsområden. Metoden är dessutom robust mot olika val av antal kluster, vilket tyder på att den kan anpassa sig väl till nya dataset.

Vad detta betyder för trasiga krukor och mer därtill

Enkelt uttryckt visar studien att en dator kan lära sig att skilja olika porslinsartefakter åt genom att studera deras mikroskopiska ”bubbel­landskap”, även när experter bara tillhandahåller få etiketter. Denna förmåga kan hjälpa museer och arkeologer att snabbare sortera stora samlingar, matcha fragment för virtuell återmontering och stödja studier av ugnsteknik och handelsnätverk. Författarna planerar att utöka sitt dataset, testa metoden på bredare bildsamlingar och ytterligare effektivisera modellen för fältbruk. När sådana verktyg mognar lovar de att förvandla sköra skärvor från tidskrävande pussel till rika, snabbt åtkomliga register över det förflutna.

Citering: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Nyckelord: porslinsföremål, mikroskopisk avbildning, självövervakad inlärning, kulturarvsrestaurering, bildklassificering