Clear Sky Science · pl

Współpraca człowieka z komputerem w odszyfrowywaniu inskrypcji na kościach wróżebnych przy użyciu generatywnych sieci przeciwstawnych

2026-04-10 · Powrót do spisu

Starożytne pismo spotyka nowoczesne maszyny

Ponad trzy tysiące lat temu chińscy wróżbici wykuwali pytania o wojnę, pogodę i zbiory na skorupach żółwi i kościach zwierzęcych. Dziś te inskrypcje na kościach wróżebnych stanowią skarbnicę wiedzy o kształtowaniu się chińskiego pisma i wczesnego społeczeństwa chińskiego. Jednak wiele z tych drobnych, zniszczonych symboli pozostaje nieodczytanych i jest ich zbyt wiele, by garstka ekspertów mogła je przeanalizować sama. Artykuł pokazuje, jak sztuczna inteligencja, współdziałając z badaczami, może pomagać w odczytywaniu tych dawnych zarysów, przekształcając je w nowoczesne formy chińskich znaków.

Z obrazków na kości do obrazów dla komputera

Pismo na kościach wróżebnych jest wyjątkowo wizualne. Wczesni skrybowie wycinali uproszczone obrazki tygrysów, słońc, ludzi i narzędzi bezpośrednio w kości, więc każdy znak przypomina niemal mały rysunek. Autorzy wykorzystują to, traktując każdy znak jako obraz, a nie linię kodu czy tekst. Zbierają ponad tysiąc par obrazów: z jednej strony sfotografowany glif z kości, z drugiej jego znany współczesny odpowiednik po chińsku. Poprzez zmianę rozmiaru i oczyszczanie tych obrazów tworzą znormalizowaną bibliotekę obrazów, od której komputer może się uczyć, przekształcając wiekowy problem odszyfrowania w współczesne zadanie tłumaczenia obrazu na obraz.

Dwóch cyfrowych artystów: uzupełniające się modele AI

Zespół trenuje dwa powiązane, lecz różne typy generatywnych sieci przeciwstawnych (GAN), czyli modeli AI, które uczą się tworzyć realistyczne obrazy poprzez rywalizację „generatora” z „krytykiem”. Jeden model, oparty na systemie zwanym Pix2Pix, uczy się z przykładów sparowanych: widzi znak z kości i dokładny współczesny znak, w który powinien się przemienić. Ten model świetnie radzi sobie z produkcją wyraźnych, dobrze uformowanych współczesnych glifów, które ściśle odpowiadają oczekiwanym kształtom. Drugi model, oparty na CycleGAN, zaprojektowano tak, by działał także wtedy, gdy przykłady nie są idealnie dopasowane. Ma tendencję do zachowywania oryginalnego szkielettu i stylu pisma z kości, jednocześnie delikatnie uregulowując je w stronę form nowoczesnych. Razem oba modele oferują różne „wersje” tego, jak stary, uszkodzony glif mógłby wyglądać w bardziej regularnym, czytelnym stylu.

Testowanie maszyn i porównywanie alternatyw

Aby sprawdzić, czy systemy robią coś więcej niż rysowanie ładnych obrazków, autorzy przeprowadzają staranny zestaw testów. Wyodrębniają 160 znanych par kość–współczesny, których AI nie widziało podczas treningu, a następnie proszą każdy model o przewidzenie współczesnych znaków na podstawie obrazów z kości. Porównują wyniki z prawdziwymi odpowiedziami przy użyciu standardowych miar jakości i struktury obrazu, a także oglądają rezultaty wizualnie. W szerszym porównaniu stawiają swoje dwa GAN-y w szranki z innymi popularnymi metodami obrazowymi, w tym modelami dyfuzyjnymi, transformatorami i klasycznymi sieciami w stylu U‑Net. Para GAN-ów wyróżnia się: Pix2Pix generuje najczystsze, najbardziej czytelne znaki, podczas gdy CycleGAN daje konserwatywne, zachowujące strukturę alternatywy. Inne metody często rozmywają pociągnięcia, łamią szkielet znaku lub tworzą kształty, które przestają przypominać pismo, co czyni je słabymi narzędziami do poważnego odszyfrowania.

Ludzie w pętli: współpraca, nie zastąpienie

Rdzeniem badań nie jest sama AI, lecz ustrukturyzowane partnerstwo między maszynami a ekspertami. Dla 150 inskrypcji, których znaczenie było wcześniej nieznane, modele generują wiele kandydatów na współczesne glify. Następnie specjaliści wybierają obiecujące propozycje i odręcznie rysują brakujące lub niepewne kreski, kierując się zarówno sugestiami AI, jak i swoją wiedzą o historii języka oraz scenach z życia codziennego odzwierciedlonych w tekstach. W szczegółowych studiach przypadku — na przykład proponując, że jeden nieznany glif znaczy „jaskinia” lub „nora” — autorzy łączą kształty sugerowane przez AI, porównania z pokrewnymi znakami i historyczne informacje o starożytnym budownictwie i rytuałach. Przeprowadzają też kontrolowane eksperymenty na 160 znanych przypadkach, porównując trzy tryby: sama AI, ludzie rysujący od zera oraz ludzie poprawiający szkice AI. Podejście skombinowane konsekwentnie generuje obrazy bliższe prawdziwym znakom, oceniane zarówno za pomocą numerycznych miar obrazu, jak i paneli ekspertów, a jednocześnie oszczędza czas i wysiłek badaczy.

Dlaczego to ważne dla historii i dziedzictwa

Dla osób spoza specjalizacji korzyść jest oczywista: każdy nowo odszyfrowany znak z kości wróżebnych wyostrza nasz obraz wczesnej historii Chin — od królewskich ofiar po rolnictwo i choroby. Praca pokazuje, że AI może robić więcej niż rozpoznawać współczesne pismo ręczne czy generować sztukę; w połączeniu z uważnym osądem ludzkim może pomagać odblokować najwcześniejsze warstwy pisanej kultury. Zamiast zastępować ekspertów, system działa jako inteligentny asystent, który podpowiada kształty, przyspiesza żmudne przerysowywanie i sprawia, że cały proces staje się bardziej przejrzysty i mierzalny. Autorzy twierdzą, że to partnerstwo człowiek–komputer mogłoby zostać rozszerzone na inne starożytne pisma i zniszczone dokumenty, przekształcając kruche znaki na kości, glinie czy pergaminie w czytelne opowieści o tym, jak ludzie kiedyś żyli, w co wierzyli i jak zapisywali swój świat.

Cytowanie: Zeng, S., Bai, J., Shi, J. et al. Human–computer collaborative approach to the decipherment of racle bone inscriptions with generative adversarial networks. npj Herit. Sci. 14, 232 (2026). https://doi.org/10.1038/s40494-026-02509-4

Słowa kluczowe: pismo kości wróżebnych, starożytne pismo, AI dla dziedzictwa kulturowego, współpraca człowiek–AI, ewolucja znaków chińskich