Clear Sky Science · sv

Forskning om mönsterigenkänning på Song-dynastins kopparspeglar baserad på MOEAD

2026-03-16 · Tillbaka till index

Varför antika speglar möter moderna maskiner

Föreställ dig att du med din telefons kamera omedelbart kan säga vilka mytiska varelser som är inristade på en tusenårig bronsspegel. Denna studie för den visionen närmare verkligheten. Författarna kombinerar avancerad bildigenkänningsprogramvara med en intelligent optimeringsstrategi för att automatiskt identifiera djurmönster på Song-dynastins bronsspeglar, vilket hjälper kuratorer, arkeologer och allmänheten att utforska kulturarvet snabbare och mer korrekt.

Lyser ljus över Song-epokens bronsspeglar

Bronsspeglar var vardagsföremål i det forntida Kina, men de bar också djup social och andlig betydelse. Under Song-dynastin dekorerades deras baksidor med intrikata scener: drakar och fenghuang, tranor och sköldpaddor, lejon och hjortar—var och en laddad med symbolik om makt, tur och tro. Stora mängder av dessa speglar har grävts fram, men identifiering av deras detaljerade mönster har länge förlitat sig på experters ögon—en metod som är långsam, subjektiv och svår att skala upp. Författarna menar att om datorer pålitligt kan känna igen dessa motiv skulle det stödja mer konsekvent katalogisering, digital bevarande och nya former av kulturell analys.

Att göra motiv till data som en dator kan läsa

För att lära en dator att ”se” dessa mönster samlade teamet först en dedikerad bildsamling med 140 bronsspeglar från Song-dynastin som visar 14 typer av djur, från drakar och fenghuang till fiskar, tigrar och mandarindukar. Varje bild märktes noggrant efter motiv och delades sedan upp i tränings-, validerings- och testuppsättningar. Eftersom datamängden är liten och vissa djur är sällsynta utökade forskarna träningsmaterialet med systematiska transformationer—beskärning, spegling, rotation, färg- och ljushetsändringar och till och med utviskning av små områden. Dessa variationer efterliknar hur riktiga föremål kan se ut under olika ljus, kameravinklar eller slitage, och hjälper modellen att lära sig kärnan i varje motiv snarare än att memorera några få perfekta exempel.

Hur det smarta igenkänningssystemet fungerar

I systemets kärna finns en djupinlärningsmodell kallad ResNet50, en slags digitalt öga som lär sig att extrahera visuella mönster från bilder. Dess konstruktion inkluderar ”genvägs”-kopplingar som hjälper information att flöda genom många lager utan att gå förlorad, vilket gör att den kan fånga både fina ytdetaljer och högre nivåers former. Ovanpå detta introducerar författarna en strategi från evolutionsberäkning känd som MOEA/D. Istället för att gissa träningsinställningar för hand låter man en virtuell population av kandidatinställningar ”utvecklas” över många omgångar. Varje kandidat bedöms utifrån flera mål på en gång: hålla prediktionsfel låga, maximera noggrannheten över etiketter och bibehålla stabilt beteende. Med tiden konvergerar algoritmen mot kombinationer av inlärningshastighet och regulariseringsstyrka som ger den bästa kompromissen mellan noggrannhet och tillförlitlighet.

Sätta systemet på prov

Forskarna jämförde sedan sin optimerade modell med tre populära alternativ: VGG16, EfficientNet-B0 och en ooptimerad version av ResNet50. Alla modeller tränades på samma spegelbilder och testades på osedda exempel. Det optimerade systemet utmärkte sig. Det uppnådde en Hamming-precision—ett mått på hur konsekvent varje etikett förutsägs—på mer än 94 % på valideringsuppsättningen och över 91 % på testuppsättningen, vilket överträffade de andra nätverken. Det visade också jämnare prestanda över kategorier, och undvek mönstret där vissa djur känns igen nästan perfekt medan andra missas helt. Ytterligare experiment, inklusive statistiska tester och ocklusionstudier som döljer delar av bilden, indikerade att vinsterna inte bara är tur: modellen fokuserar verkligen på motivregionerna och gör det på ett repeterbart sätt, även för några av de mer sällsynta djuren.

Vad detta betyder för kulturarvet

För icke-specialister är slutsatsen enkel: studien visar att noggrant finjusterad artificiell intelligens pålitligt kan upptäcka djur på århundraden gamla bronsspeglar, med minimal extra beräkningskostnad och mindre beroende av enbart expertbedömning. Även om modellen fortfarande har svårigheter med mycket sällsynta eller visuellt lika motiv erbjuder den redan ett praktiskt verktyg för museer och forskare att snabba upp katalogisering och stödja digitala arkiv. När större bildsamlingar blir tillgängliga och metoden förfinas—möjligen med kraftfullare datagenerering och förklarbara visualiseringar—kan liknande tillvägagångssätt utvidgas till andra artefakter, från skulpterad sten till målade textilier, och göra den osynliga strukturen i vårt materiella förflutna synlig för både forskare och en bredare allmänhet.

Citering: Feng, Q., Yu, K., Li, Y. et al. Research on Song dynasty copper mirror pattern recognition based on MOEAD. npj Herit. Sci. 14, 158 (2026). https://doi.org/10.1038/s40494-026-02413-x

Nyckelord: Bronsspeglar från Song-dynastin, AI för kulturarv, bildmönsterigenkänning, optimering för djupinlärning, klassificering av artefaktsmotiv