Clear Sky Science · pl

InSwAV: involucja wzmacniająca grupowanie cech i zamienione przypisania do klasyfikacji mikroskopowych obrazów zabytków porcelany

· Powrót do spisu

Dlaczego stłuczona porcelana ma znaczenie dla współczesności

W Chinach i poza nimi wykopaliska archeologiczne wydobywają góry rozbitych fragmentów porcelany. Każdy odłamek niesie wskazówki o tym, jak ludzie żyli, handlowali i opanowali wypalanie w wysokich temperaturach wieki temu. Sortowanie i dopasowywanie tych niezliczonych skrawków pozostaje jednak czasochłonną pracą ekspertów. W pracy tej przedstawiono nowe podejście oparte na sztucznej inteligencji, zwane InSwAV, które uczy się na mikroskopowych obrazach powierzchni porcelany, aby automatycznie grupować fragmenty według typu. Szybsza i bardziej niezawodna klasyfikacja mogłaby znacząco przyspieszyć prace konserwatorskie i pogłębić nasze rozumienie dziedzictwa kulturowego.

Figure 1
Figure 1.

Dostrzeganie historii w maleńkich pęcherzykach

Dla oka wiele kawałków porcelany wygląda myląco podobnie: białe lub bladozielone szkliwa, starte wzory i uszkodzone krawędzie. Pod mikroskopem jednak ukazuje się inny świat. Maleńkie pęcherzyki uwięzione w szkliwie rejestrują szczegóły gliny, receptury szkliwa, temperatury wypału, a nawet nawyki poszczególnych pieców czy warsztatów. Wcześniejsze badania wykazały, że rozmiar, kształt i rozmieszczenie tych pęcherzyków różnią się między ośrodkami produkcji i okresami, co czyni je silnymi „odciskami palców” do identyfikacji i datowania. Ręczne wydobywanie i interpretowanie tych subtelnych wzorców lub użycie tradycyjnych narzędzi przetwarzania obrazu jest jednak pracochłonne i wrażliwe na zakłócenia.

Pozwolić komputerowi uczyć się samemu

Główną przeszkodą w tej dziedzinie jest brak oznakowanych danych: specjaliści mogą adnotować tylko ograniczoną liczbę mikroskopowych obrazów, a niektóre typy fragmentów są rzadkie. Zamiast polegać na tysiącach przykładów oznakowanych przez ekspertów, autorzy sięgają po uczenie samonadzorowane, gdzie sieć neuronowa jest trenowana, by samodzielnie odkrywać strukturę w danych. Zbudowali zbiór Porcelain Relic Microscopic Image (PRMI), zawierający 7425 obrazów o wysokim powiększeniu z pięciu kategorii porcelany. Dla każdego oryginalnego mikrografu system tworzy wiele przeobrażonych wersji przez kadrowanie, obracanie, lekką zmianę kolorów i rozmycie. Te „widoki” pokazują ten sam materiał w różny sposób, zachęcając komputer do skupienia się na trwałych, znaczących cechach zamiast powierzchownych detali.

Figure 2
Figure 2.

Mądrzejszy sposób dostrzegania wzorców

Rdzeń metody stanowi InSwAV, sieć oparta na niestandardowym ekstraktorze cech nazwanym ResInv. Standardowe sieci obrazowe używają stałych filtrów splotowych przesuwających się po obrazie. ResInv zamiast tego łączy je z operacjami „involution”, które dostosowują swoje działanie w zależności od pozycji, lepiej chwytając nieregularne, wieloskalowe kształty pęcherzy i spękań szkliwa. Gdy ResInv przekształci każdy obraz w zwarty podpis, InSwAV nie porównuje ze sobą pojedynczych obrazów bezpośrednio. Zamiast tego przypisuje je do zestawu wyuczonych „prototypów”, czyli środków klastrów, a następnie sprawdza, czy różne uzupełnione widoki tego samego fragmentu trafiają do zgodnych klastrów. Matematyczny etap wyrównywania zapobiega leniwemu wrzucaniu wszystkiego do kilku grup, zmuszając model do odkrycia rzeczywistej, drobniejszej struktury.

Dokładność, szybkość i co one odsłaniają

Na zbiorze PRMI InSwAV poprawnie rozróżnia pięć kategorii porcelany w 96,2% przypadków, wyraźnie przewyższając kilka czołowych metod samonadzorowanych, a nawet silną metodę nadzorowaną mającą dostęp do etykiet. Trenuje też znacznie szybciej, osiągając wysoką dokładność po zaledwie kilku godzinach na nowoczesnym sprzęcie graficznym. Wizualizacje wewnętrznej aktywności sieci pokazują, że ResInv koncentruje się na pęcherzykach i kluczowych mikrostrukturach, podczas gdy standardowa architektura ma skłonność do rozpraszania się obszarami tła. Podejście jest również odporne na różne wybory liczby klastrów, których model używa, co sugeruje dobrą zdolność adaptacji do nowych zbiorów danych.

Co to oznacza dla stłuczonych naczyń i nie tylko

Mówiąc prosto, badanie pokazuje, że komputer może nauczyć się rozróżniać różne zabytkowe porcelany, analizując ich mikroskopijne „krajobrazy pęcherzyków”, nawet gdy eksperci dostarczają niewiele etykiet. Ta umiejętność może pomóc muzeom i archeologom szybciej sortować duże zbiory, dopasowywać odłamki do wirtualnego składania i wspierać badania technologii pieców oraz sieci handlowych. Autorzy planują rozszerzyć swój zbiór danych, przetestować metodę na szerszych kolekcjach obrazów i dodatkowo uprościć model do zastosowań terenowych. W miarę dojrzewania takich narzędzi obiecują przekształcić kruche odłamki z czasochłonnych łamigłówek w bogate, szybko dostępne zapisy przeszłości.

Cytowanie: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Słowa kluczowe: zabytki porcelany, obrazowanie mikroskopowe, uczenie samonadzorowane, konserwacja dziedzictwa kulturowego, klasyfikacja obrazów