Clear Sky Science · sv

Forskning om upptäckt av batikmönster i bilder baserat på förbättrad YOLOv11

· Tillbaka till index

Forntida tyg möter modern kod

Batiktyger från Kinas Miao-samhällen är mer än dekoration: deras fjärilar, drakar, fåglar och blommor dokumenterar tyst historia, trosföreställningar och vardagsliv i avsaknad av ett skriftspråk. När dessa textilier åldras och yngre generationer rör sig bort från traditionellt hantverk riskerar viktig kulturell information att gå förlorad i högar av oetiketterade foton och bleknande tyger. Denna studie visar hur avancerad bildigenkänningsmjukvara automatiskt kan hitta och identifiera små, överlappande motiv i komplexa batikbilder, och därigenom erbjuda ett nytt sätt att bevara och utforska denna levande konstform i större skala.

Figure 1
Figure 1.

Varför dessa mönster spelar roll

Kinesisk batik är en handfärgningsteknik som blomstrat i mer än två årtusenden, särskilt bland Miao-folket i Guizhou-provinsen. Eftersom denna gemenskap historiskt saknade ett skriftspråk blev batikmotiv en visuell arkiv av myter, ritualer, estetik och sociala sedvänjor. Forskare har börjat digitalisera och analysera dessa mönster med verktyg från matematik, design och artificiell intelligens. Tidigare arbete kunde klassificera isolerade motiv relativt väl, men krävde ofta att man skar ut dem ur det ursprungliga tyget, vilket bröt banden mellan varje symbol och den större kompositionen. Det gjorde det svårt att förstå hur motiv samverkar på ett plagg eller textil för att förmedla flerdimensionella betydelser.

Från enkla etiketter till smart upptäckt

Författarna hävdar att det som behövs inte bara är klassificering utan fullständig objektdetektion: att lokalisera varje motiv i ett komplett fotografi och namnge dess typ. Det är ett svårt problem i verkliga batikbilder, där mönster trängs ihop, varierar kraftigt i storlek och ofta är utslitna, spruckna eller delvis dolda. Standarddetektionssystem, inklusive tidigare versioner av den populära YOLO (”You Only Look Once”)-familjen, hade problem med dessa förhållanden. De missade ofta mycket små symboler, förväxlades av invecklade bakgrunder eller sviktade när ljusförhållanden och bildkvalitet var ojämna—exakt den typ av bilder som kuratorer och fältforskare oftast samlar in.

Att lära ett neuralt nätverk läsa tyg

För att tackla dessa utmaningar skapade teamet först det som nu är den största kinesiska batikdetektionsdatasetten: 861 högupplösta bilder annoterade med 9933 begränsningsrutor över sju motifkategorier (fjäril, fisk, drake, fågel, trumma, blomma och frukt). De balanserade noggrant bildstorlek och kvalitet, och utökade den begränsade datamängden genom kontrollerad suddning, färgändringar, speglingar, mosaiker och andra transformationer så att modellen inte bara skulle memorera träningsproverna. Ovanpå denna dataset byggde de en förbättrad version av YOLOv11, ett modernt objektidentifieringsramverk valt för sin hastighet och kompakta storlek—viktiga egenskaper om verktyget ska köras på vanliga datorer i museer och kulturcenter.

Se längre och tydligare

Den förbättrade modellen lägger till två nyckelidéer. För det första tillförs en komponent inspirerad av VOLO:s ”vision outlooker”-mekanism som låter nätverket se över avlägsna delar av bilden samtidigt, istället för endast i små lokala områden. Det hjälper modellen att känna igen att två små former som ligger långt ifrån varandra kan tillhöra samma meningsbärande mönster, och att ett motivs roll beror på dess grannar. För det andra omarbetade teamet hur nätverket bearbetar bildfunktioner genom en struktur kallad Fused-MBConv. Denna redesign håller beräkningarna effektiva samtidigt som modellens förmåga att urskilja subtila detaljer i brusiga, åldrade tyger skärps. I tester och noggranna ablationsstudier uppnådde deras slutliga design högre genomsnittlig detektionsnoggrannhet än baslinjen YOLOv11 och flera andra lätta detektorer, samtidigt som den fortfarande körs tillräckligt snabbt för realtids- eller nästintill realtidsanvändning.

Figure 2
Figure 2.

Från automatiska taggar till kulturella berättelser

Bortom råa detektionspoäng kopplade forskarna sin modell till en batikkunskapsgraf som länkar varje motiftyp till berättelser om dess ursprung, symboliska betydelser och relaterade exempel. I ett prototypsystem kan en användare ladda upp ett foto av ett tyg, se de upptäckta motiven markerade och sedan klicka vidare för att utforska deras kulturella bakgrund. För arkivarier betyder det snabbare och mer konsekvent katalogisering av stora samlingar. För pedagoger och besökare förvandlas mönsterigenkänning till en ingång för att lära sig om Miao-folkets trosföreställningar, ritualer och estetik. Även om det nuvarande systemet endast är tränat på kinesisk batik ser författarna det som en mall för tvärkulturella verktyg som en dag skulle kunna hjälpa till att skydda textiltraditioner från Indonesien till Indien, och därigenom säkerställa att mönstren på tyger fortsätter att tala, även när tygerna själva åldras och bleknar.

Citering: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y

Nyckelord: upptäckt av batikmönster, immateriellt kulturarv, datorseende, YOLO-objektupptäckt, Miao-textilkonst