Clear Sky Science · pl

Segmentacja semantyczna chmur punktów twarzy Buddy za pomocą prowadzonego wiedzą wzrostu regionów

· Powrót do spisu

Odczytywanie twarzy historii

Rzeźby Buddy wyciosane w klifach i ścianach świątyń to nie tylko piękne dzieła sztuki — to trójwymiarowe zapisy wierzeń religijnych, mody artystycznej i wymiany kulturowej na przestrzeni wieków. W tym badaniu pokazano, jak informatycy i konserwatorzy dziedzictwa mogą „czytać” te kamienne twarze w szczegółach, automatycznie oddzielając oczy, nos, usta i inne cechy ze szczegółowych pomiarów 3D, nawet gdy nie ma przykładów opisanych etykietami, na których można by się uczyć. Celem jest zmiana milczącego kamienia w mierzalne dane, które pomagają historykom porównywać style, śledzić zmiany w czasie i planować ostrożne prace konserwatorskie.

Dlaczego cyfrowe twarze są ważne

W znanych miejscach, takich jak Dunhuang, Yungang i Longmen, twarze Buddy różnią się subtelnie w zależności od dynastii i regionu — jedne są bardziej pełne, inne smuklejsze, z łagodniejszymi oczami lub bardziej wydatnym nosem. Tradycyjnie historycy sztuki opisują te różnice „na oko”; dziś precyzyjne skany 3D rejestrują powierzchnię rzeźb jako miliony punktów w przestrzeni. Jednak te «chmury punktów» są nieporadne: nie mają koloru ani tekstury i nie wskazują, gdzie kończą się oczy, a zaczynają policzki. Istniejące metody automatyczne albo wymagają wielu ręcznie opisanych przykładów treningowych, których po prostu nie ma dla zabytkowych rzeźb, albo dzielą powierzchnie wyłącznie na podstawie geometrii, ignorując rzeźbiarskie reguły, których rzeczywiście przestrzegali twórcy.

Figure 1
Figure 1.

Nauczanie algorytmów reguł twarzy

Zamiast próbować uczyć się z ubogich danych, autorzy zaczynają od wiedzy, którą sami stosowali rzeźbiarze. Tradycyjne podręczniki buddyjskie opisują standardowe proporcje twarzy, takie jak dzielenie twarzy na równe tercje dla czoła, nosa i brody, oraz zachowanie symetrii względem osi środkowej. Badacze tłumaczą tę kulturową i anatomiczną wiedzę na proste reguły geometryczne: płaszczyznę symetrii pośrodku; pionową linię biegnącą przez środek nosa; oraz proporcje wiążące położenie i rozmiary oczu, nosa, ust, uszu i brody. Reguły te nie są sztywnymi szablonami: zawierają parametry regulowane tak, by pełniejsze twarze w stylu Tang i smuklejsze twarze w stylu Song mieściły się w elastycznym, ale rozpoznawalnym schemacie.

Rozszerzanie regionów od nasion

Pracując na oczyszczonym skanie 3D, metoda najpierw ustawia twarz Buddy tak, by patrzyła prosto przed siebie, a następnie projektuje powierzchnię na kwadratową siatkę, przekształcając kształt 3D w coś na kształt cieniowanej mapy wysokości. W tej siatce algorytm wybiera początkowe pozycje „nasion” dla każdej cechy twarzy, wspomagany przez wcześniejsze reguły: „nasiono” nosa leży w pobliżu pionowej linii środkowej i lokalnego punktu najwyższego, oczy umieszczone są w symetrycznych wzniesieniach po obu stronach, usta znajdują się poniżej nosa w płytkim zagłębieniu itd. Z każdego nasiona komputer „rośnie” region na zewnątrz, dodając sąsiednie komórki tylko wtedy, gdy ich wysokość i nachylenie odpowiadają temu, czego spodziewalibyśmy się po grzbiecie nosa, a nie po policzku. Dodatkowe kroki porządkują wynik, przycinając rozrzucone fragmenty, wypełniając małe luki i delikatnie wygładzając kontury, tak by segmentowane oczy, wargi i broda wyglądały na ciągłe i wiarygodne zarówno dla komputera, jak i eksperta ludzkiego.

Testowanie metody

Zespół przetestował swoje podejście na piętnastu twarzach Buddy — dziewięciu syntetycznych modelach o kontrolowanych kształtach oraz sześciu rzeczywistych skanach z renomowanych chińskich miejsc dziedzictwa. Jakość mierzono tym, jak dobrze automatycznie wysegementowane regiony pokrywały się ze starannie odręcznymi obrysami sporządzonymi przez specjalistów oraz jak blisko obliczone granice odpowiadały konturom ekspertów. W obrębie oczu, brwi, uszu, nosa, ust i brody metoda osiągnęła wysokie wyniki, co oznacza, że większość punktów została poprawnie przypisana do właściwej cechy. Co ważne, rezultaty były stabilne niezależnie od różnych stylów rzeźbienia i stopnia zużycia powierzchni. Gdy autorzy porównali swoje podejście z popularnym modelem głębokiego uczenia trenowanym na zaledwie garści oznaczonych przykładów, sieć żądna danych radziła sobie słabo, podczas gdy metoda prowadzona wiedzą pozostawała dokładna bez potrzeby dużych zbiorów treningowych.

Figure 2
Figure 2.

Znaczenie dla dziedzictwa

Przekształcając tradycyjne reguły pomiarowe rzeźbiarzy w nowoczesny algorytm, badanie pokazuje, że komputery mogą segmentować twarze Buddy w 3D przy niewielkiej lub żadnej ręcznej etykietacji, a jednocześnie respektować kulturową logikę oryginalnego dzieła. Dla historyków otwiera to drogę do systematycznych, ilościowych porównań stylów twarzy między miejscami i okresami; dla konserwatorów daje precyzyjne narzędzie do monitorowania uszkodzeń lub kierowania cyfrową rekonstrukcją. W istocie metoda przekształca wiekowe konwencje dotyczące idealnej twarzy Buddy w praktyczne narzędzie do czytania, zachowywania i rozumienia kamiennych twarzy, które strzegły świątyń i grot przez ponad tysiąc lat.

Cytowanie: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Słowa kluczowe: Skanowanie 3D rzeźb Buddy, digitalizacja dziedzictwa kulturowego, segmentacja chmur punktów, proporcje twarzy w sztuce, algorytmy prowadzone wiedzą