Clear Sky Science · pl
Badania nad rozpoznawaniem wzorów na miedzianych lustrach z dynastii Song oparte na MOEA/D
Dlaczego starożytne lustra spotykają nowoczesne maszyny
Wyobraź sobie, że za pomocą aparatu w telefonie możesz natychmiast rozpoznać, jakie mityczne stworzenia są wyryte na tysiącletnim brązowym lustrze. To badanie przybliża taką wizję do rzeczywistości. Autorzy łączą zaawansowane oprogramowanie do rozpoznawania obrazów z inteligentną strategią optymalizacyjną, aby automatycznie identyfikować zwierzęce wzory na lustrach z dynastii Song, pomagając kuratorom, archeologom i szerokiej publiczności szybciej i dokładniej poznawać skarby kultury.

Rzucając światło na lustra z epoki Song
Brązowe lustra były przedmiotami codziennego użytku w starożytnych Chinach, ale niosły też głębokie znaczenia społeczne i duchowe. W czasach dynastii Song ich tylne strony zdobiły skomplikowane sceny: smoki i feniksy, żurawie i żółwie, lwy i jelenie — każde naładowane symboliką władzy, szczęścia i wierzeń. Wykopano wiele takich luster, lecz rozpoznawanie ich szczegółowych wzorów od dawna opiera się na oku eksperta — podejściu powolnym, subiektywnym i trudnym do skalowania. Autorzy twierdzą, że gdyby komputery potrafiły niezawodnie rozpoznawać te motywy, umożliwiłoby to bardziej spójne katalogowanie, cyfrową konserwację i nowe rodzaje analiz kulturowych.
Przekształcanie motywów w dane czytelne dla komputera
Aby nauczyć komputer „widzieć” te wzory, zespół najpierw zgromadził dedykowaną kolekcję obrazów 140 brązowych luster z dynastii Song przedstawiających 14 typów zwierząt — od smoków i feniksów po ryby, tygrysy i mandarynki. Każde zdjęcie zostało starannie oznaczone według motywu, a następnie podzielone na zbiory treningowe, walidacyjne i testowe. Ponieważ zestaw danych jest niewielki, a niektóre zwierzęta występują rzadko, badacze rozszerzyli materiał treningowy za pomocą systematycznych transformacji — przycinania, odbicia, rotacji, zmiany koloru i jasności, a nawet usuwania małych fragmentów. Te wariacje naśladują sposób, w jaki artefakty mogą wyglądać przy różnych warunkach oświetlenia, kątach fotografowania czy stopniu zużycia, pomagając modelowi nauczyć się istoty każdego motywu zamiast zapamiętywać kilka nienaruszonych przykładów.
Jak działa inteligentny system rozpoznawania
Rdzeniem systemu jest model uczenia głębokiego o nazwie ResNet50 — rodzaj cyfrowego oka, które uczy się wyodrębniać wzorce wizualne z obrazów. Jego architektura zawiera „skrócone” połączenia, które pomagają informacji przepływać przez wiele warstw bez gubienia istotnych cech, co pozwala uchwycić zarówno drobne detale powierzchni, jak i bardziej złożone kształty. Na tej bazie autorzy wprowadzają strategię z obliczeń ewolucyjnych znaną jako MOEA/D. Zamiast ręcznie dobierać ustawienia treningu, pozwalają wirtualnej populacji kandydatów „ewoluować” przez wiele rund. Każdy kandydat oceniany jest według kilku celów jednocześnie: minimalizowania błędów predykcji, maksymalizowania trafności etykiet i utrzymywania stabilnego zachowania. Z czasem algorytm konwerguje do kombinacji szybkości uczenia i siły regularizacji, które zapewniają najlepszy kompromis między dokładnością a niezawodnością.

Testowanie systemu
Następnie badacze porównali zoptymalizowany model z trzema popularnymi alternatywami: VGG16, EfficientNet-B0 oraz niezoptymalizowaną wersją ResNet50. Wszystkie modele trenowano na tych samych zdjęciach luster i testowano na niewidzianych wcześniej przykładach. Zoptymalizowany system wyróżnił się. Osiągnął dokładność Hammingową — miarę zgodności przewidywań dla poszczególnych etykiet — powyżej 94% na zbiorze walidacyjnym i ponad 91% na zbiorze testowym, przewyższając pozostałe sieci. Pokazał też bardziej równomierne wyniki w różnych kategoriach, unikając sytuacji, w której niektóre zwierzęta są rozpoznawane prawie idealnie, a inne całkowicie pomijane. Dodatkowe eksperymenty, w tym testy statystyczne i badania z zasłanianiem fragmentów obrazu, wykazały, że poprawy nie są przypadkowe: model naprawdę koncentruje się na regionach zawierających motywy i robi to w sposób powtarzalny, nawet dla niektórych rzadkich zwierząt.
Co to znaczy dla dziedzictwa kulturowego
Dla osób spoza branży wniosek jest prosty: badanie pokazuje, że starannie dostrojona sztuczna inteligencja może niezawodnie rozpoznawać zwierzęta na wiekowych brązowych lustrach przy niewielkim dodatkowym koszcie obliczeniowym i mniejszej zależności od jedynie eksperckiej oceny. Chociaż model wciąż ma problemy z bardzo rzadkimi lub wizualnie podobnymi motywami, już teraz oferuje praktyczne narzędzie dla muzeów i badaczy do przyspieszenia katalogowania i wsparcia archiwów cyfrowych. W miarę pojawiania się większych zbiorów obrazów i udoskonalania metody — być może dzięki silniejszym technikom generacji danych i wyjaśnialnym wizualizacjom — podobne podejścia można rozszerzyć na inne artefakty, od rzeźbionego kamienia po malowane tkaniny, odsłaniając niewidoczną strukturę naszej materialnej przeszłości zarówno dla naukowców, jak i szerokiej publiczności.
Cytowanie: Feng, Q., Yu, K., Li, Y. et al. Research on Song dynasty copper mirror pattern recognition based on MOEAD. npj Herit. Sci. 14, 158 (2026). https://doi.org/10.1038/s40494-026-02413-x
Słowa kluczowe: brązowe lustra z dynastii Song, SZT w dziedzictwie kulturowym, rozpoznawanie wzorów w obrazach, optymalizacja uczenia głębokiego, klasyfikacja motywów artefaktów