Clear Sky Science · pl

Badania nad wykrywaniem wzorów na obrazach batiku oparte na ulepszonym YOLOv11

· Powrót do spisu

Starożytna tkanina spotyka współczesny kod

Tkanina batikowa społeczności Miao w Chinach to coś więcej niż ozdoba: jej motyle, smoki, ptaki i kwiaty w sposób cichy zapisują historię, wierzenia i codzienne życie tam, gdzie brakowało pisma. Jednak w miarę jak te tekstylia starzeją się, a młodsze pokolenia odsuwają się od tradycyjnego rzemiosła, cenne informacje kulturowe mogą zaginąć w stertach nieopisanych zdjęć i blaknących tkanin. W niniejszym badaniu pokazano, jak zaawansowane oprogramowanie do rozpoznawania obrazów może automatycznie odnajdywać i identyfikować drobne, nachodzące na siebie motywy w złożonych obrazach batiku, oferując nowy sposób zachowania i badania tej żywej sztuki na dużą skalę.

Figure 1
Figure 1.

Dlaczego te wzory mają znaczenie

Chiński batik to ręczna technika barwienia, rozwijająca się przez ponad dwa tysiąclecia, szczególnie wśród ludu Miao w prowincji Guizhou. Ponieważ ta społeczność historycznie nie miała systemu pisanego, motywy batikowe stały się wizualnym archiwum mitów, rytuałów, estetyki i zwyczajów społecznych. Badacze zaczęli digitalizować i analizować te wzory przy użyciu narzędzi z zakresu matematyki, projektowania i sztucznej inteligencji. Wcześniejsze prace potrafiły dość dobrze klasyfikować izolowane motywy, ale zwykle wymagały wycięcia ich z oryginalnej tkaniny, co przerywało związek między symbolem a większą kompozycją. Utrudniało to zrozumienie, jak motywy współdziałają na stroju lub materiale, przekazując wielowarstwowe znaczenia.

Od prostych etykiet do inteligentnej detekcji

Autorzy argumentują, że potrzebna jest nie tylko klasyfikacja, lecz pełna detekcja obiektów: zlokalizowanie każdego motywu na kompletnym zdjęciu i określenie jego typu. To trudne zadanie w rzeczywistych obrazach batiku, gdzie wzory gęsto się stykają, różnią znacznie rozmiarem i często są wyblakłe, popękane lub częściowo zakryte. Standardowe systemy detekcji, w tym wcześniejsze wersje popularnej rodziny algorytmów YOLO („You Only Look Once”), miały problemy w takich warunkach. Zwykle pomijały bardzo małe symbole, gubiły się na skomplikowanych tłach lub zawodziły przy nierównomiernym oświetleniu i jakości zdjęć — dokładnie w tych sytuacjach, które kuratorzy i badacze terenowi najczęściej zbierają.

Nauka sieci neuronowej czytania tkaniny

Aby sprostać tym wyzwaniom, zespół najpierw stworzył obecnie największy zbiór danych do wykrywania chińskiego batiku: 861 zdjęć w wysokiej rozdzielczości z 9933 obwiedniami (bounding boxes) przypisanymi do siedmiu kategorii motywów (motyl, ryba, smok, ptak, bęben, kwiat i owoc). Starannie zbalansowali rozmiar i jakość zdjęć oraz rozszerzyli ograniczony zbiór danych, stosując kontrolowane rozmycia, zmiany kolorów, odbicia, mozaiki i inne transformacje, aby model nie zapamiętywał jedynie próbek treningowych. Na bazie tego zbioru zbudowali ulepszoną wersję YOLOv11, nowoczesnego systemu detekcji obiektów wybranego ze względu na szybkość i kompaktowość — cechy ważne, jeśli narzędzie ma działać na zwykłych komputerach w muzeach i centrach kultury.

Patrzenie dalej i widzenie wyraźniej

Ulepszony model wprowadza dwie kluczowe idee. Po pierwsze, komponent inspirowany mechanizmem VOLO „vision outlooker” pozwala sieci patrzeć jednocześnie na odległe części obrazu, a nie tylko na małe lokalne sąsiedztwa. Pomaga to rozpoznać, że dwa drobne kształty daleko od siebie mogą należeć do tego samego znaczącego wzoru i że rola motywu zależy od jego sąsiadów. Po drugie, zespół przeprojektował sposób przetwarzania cech obrazu za pomocą struktury zwanej Fused-MBConv. Ta przebudowa utrzymuje obliczenia efektywne, jednocześnie wyostrzając zdolność modelu do wydobywania subtelnych detali z zaszumionych, postarzałych tkanin. W testach i szczegółowych badaniach ablacjnych ich końcowy projekt osiągnął wyższą średnią dokładność wykrywania niż bazowy YOLOv11 i kilka innych lekkich detektorów, przy jednoczesnym utrzymaniu wystarczającej szybkości do użycia w czasie rzeczywistym lub bliskim rzeczywistemu.

Figure 2
Figure 2.

Od automatycznych etykiet do opowieści kulturowych

Ponad surowe wyniki detekcji, badacze połączyli swój model z grafem wiedzy o batiku, który łączy każdy typ motywu z opowieściami o jego pochodzeniu, znaczeniach symbolicznych i powiązanych przykładach. W prototypowym systemie oprogramowania użytkownik może przesłać zdjęcie tkaniny, zobaczyć wyróżnione wykryte motywy, a następnie kliknąć, by poznać ich kontekst kulturowy. Dla archiwistów oznacza to szybsze i bardziej spójne katalogowanie dużych kolekcji. Dla edukatorów i zwiedzających przekształca to rozpoznawanie wzorów w punkt wejścia do poznawania wierzeń, rytuałów i estetyki Miao. Chociaż obecny system jest trenowany jedynie na chińskim batiku, autorzy widzą w nim model dla narzędzi międzykulturowych, które kiedyś mogłyby pomóc chronić tradycje tekstylne od Indonezji po Indie, zapewniając, że wzory na tkaninach będą wciąż przemawiać, nawet gdy same materiały postarzeją i zbladną.

Cytowanie: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y

Słowa kluczowe: wykrywanie wzorów batiku, niematerialne dziedzictwo kulturowe, wizja komputerowa, detekcja obiektów YOLO, sztuka tekstylna Miao