Clear Sky Science · sv

Fusionsmetod för bilder från flera vinklar med kunskapsdestillering för klassificering av gamla glaspärlor utgrävda i Japan

2026-01-17 · Tillbaka till index

Pärlor som tidskapslar

I mer än tusen år färdades små glaspärlor längs handelsvägar från Medelhavet och Indien till den japanska övärlden. Idag är dessa färgglada fragment bland de vanligaste föremålen som grävs fram i Japan — över 600 000 har hittats — men att ta reda på exakt var de tillverkades kräver oftast långsamma, dyra kemiska tester och en specialists tränade öga. Denna studie ställer en enkel men kraftfull fråga: kan vanliga fotografier och modern AI ersätta laboratoriet, och hjälpa arkeologer att snabbt och varsamt spåra pärlornas resor?

Varför gammalt glas är viktigt

Glaspärlor är mer än smycken; de är ledtrådar till långväga kontakter över Eurasien. Olika regioner använde särskilda blandningar av råmaterial och färgämnen, vilket gav kemiska ”signaturer” som specialister använder för att gruppera pärlor i familjer kopplade till platser som Östasien, Indien, Sydostasien, Centralasien och Medelhavet. Traditionellt proveniensarbete bygger på instrument som mäter kemiska komponenter och på experter som granskar former, färger och tillverkningsmärken under förstorning. Dessa metoder har avslöjat rika berättelser om forntida handel, men de är svåra att skala upp till hundratusentals ömtåliga föremål som förvaras i museer och förråd runt om i Japan.

Från laboratoriemätningar till enkla fotografier

För att lösa denna flaskhals undersöker författarna en metod som endast använder bilder av pärlorna. I stället för att lösa upp en glasskiva för analys fotograferar de varje pärla från två vinklar: en vy uppifrån som visar det ringformade hålet och övergripande färgmönster, och en sidovy som visar tjocklek och profil. Denna dubbla vy efterliknar hur mänskliga experter hanterar föremål, genom att vrida dem i handen för att fånga subtila förändringar i ytstruktur och form. Målet är ambitiöst: med bara dessa bilder, kan en dator automatiskt tilldela varje pärla till en av 16 etablerade kemiska och regionala grupper som arkeologer redan använder?

Lära maskiner att se som experter

Teamet vänder sig till ett hybridartificiellt intelligenssystem kallat MidNet. Det kombinerar två ledande bildanalysstrategier. Den ena, känd som ett konvolutionellt neuralt nätverk, är särskilt bra på att plocka upp fina detaljer såsom små gropar, färgstreck eller ytsskador. Den andra, en vision transformer, är utformad för att se den större helheten — hur färger och former relaterar över hela pärlan. MidNet bearbetar båda vyerna (uppifrån och från sidan) genom båda typerna av modeller och uppmuntrar dem sedan att ”komma överens” med varandra. Under träningen lär sig varje modell inte bara från den korrekta etiketten utan också från sin partners förutsägelser och från den alternativa vyn. Detta fram-och-tillbaka-utbyte minskar risken att systemet fastnar vid egenheter hos en viss vinkel eller modelltyp istället för de bestående visuella egenskaper som är kopplade till ursprung.

Arbeta med ojämna och ofullständiga data

Datasatsen bakom MidNet består av 3 434 pärlbilder vars klasser tidigare fastställts genom noggrann expertstudie och kemisk analys. Vissa pärltyper är talrika, medan andra representeras av bara ett par exempel — ett vanligt problem inom arkeologi. För att hindra AI:n från att helt enkelt favorisera de vanligaste klasserna använde forskarna två knep. För det första genererade de ytterligare träningsbilder för mycket sällsynta typer med hjälp av en modern bildsyntesteknik, vilket skapade trovärdiga variationer utan att röra vid föremålen själva. För det andra deformade de medvetet träningsfotonen — genom att lätt ändra färg, beskära eller dölja små partier — för att göra systemet mindre känsligt för mindre skador eller ljusskillnader. De utvärderade sedan prestanda med en rigorös korsvalideringsprocedur för att se hur väl metoden skulle generalisera till osedda pärlor.

Hur bra fungerar systemet?

När forskarna jämförde sitt hybrida MidNet med mer standardmodeller för bildanalys fann de att användningen av både top- och sidovy alltid hjälpte, vilket bekräftar att de två vinklarna fångar kompletterande ledtrådar. I termer av rå noggrannhet matchade MidNet den bästa konkurrerande metoden inom ett fåtal pärlor av tusentals, men det visade det mest stabila beteendet över olika testsplitar. Med andra ord varierade dess prestanda mindre från en experimentell uppdelning till nästa, vilket indikerar att det är mindre känsligt för vilka specifika pärlor som råkar finnas i träningsuppsättningen — en avgörande egenskap vid hantering av sällsynta föremålstyper. Metoden har fortfarande problem med vissa liknande kategorier som även specialister har svårt att skilja åt, vilket tyder på ett ”ultrafinkornigt” problem där skillnaderna nästan är omärkliga enbart i fotografier.

Vad detta betyder för framtida utgrävningar

Denna studie visar att noggrann fotografering plus avancerad bildanalys kan uppskatta var många gamla glaspärlor tillverkades, utan att röra deras kemi. För arkeologer öppnar det dörren för snabb, lågkostnads och icke-destruktiv sortering av stora samlingar, även i fält eller på små museer som saknar laboratorier. Medan utmanande fall fortfarande kommer att kräva expertdömande och kemiska tester, skulle ett system som MidNet kunna hantera huvuddelen av rutinmässig klassificering, lyfta fram ovanliga föremål och stödja stora digitala arkiv som spårar glasets rörelse över kontinenter och århundraden. Kort sagt visar arbetet hur artificiell intelligens kan hjälpa till att återskapa mänsklig historia, en liten pärla i taget.

Citering: Fukuchi, T., Tamura, T. & Fukunaga, K. Multi-view image fusion using knowledge distillation for classification of ancient glass beads excavated in Japan. npj Herit. Sci. 14, 41 (2026). https://doi.org/10.1038/s40494-026-02305-0

Nyckelord: arkeologi, glaspärlor, maskininlärning, bildbaserad klassificering, kulturarv