Clear Sky Science · pl
Przetwarzanie informacji na inskrypcjach na kościach wróżebnych: kompleksowy przegląd
Starożytne kości, nowoczesne pytania
Ponad 3 000 lat temu wróżbici w Chinach wyrywali na skorupach żółwi i kościach wołów pytania do swoich władców, a następnie łamali je ogniem, by odczytywać omen. Te inskrypcje na kościach wróżebnych są najwcześniej znanym chińskim pismem i rzadkim oknem na politykę, religię i codzienne życie epoki brązu. Dzisiaj jednak kości są silnie zniszczone, pismo trudne do odczytania, a wiele znaków pozostaje nierozszyfrowanych. Artykuł wyjaśnia, jak nowe fale sztucznej inteligencji przekształcają sposoby, w jakie uczeni oczyszczają, rekonstruują, czytają i interpretują te kruche ślady przeszłości, oraz jakie wyzwania wciąż stoją na drodze.

Od ręki i oka do krzemu i kodu
Przez większość ostatniego stulecia kości wróżebne mogli studiować jedynie nieliczni eksperci, którzy żmudnie analizowali odbitki tuszem, przepisy i fotografie. Kompilowali obszerne katalogi drukowane, proponowali odczyty poszczególnych znaków i spierali się o datowanie oraz grupowanie inskrypcji. Ta praca stworzyła fundamenty dziedziny, ale była powolna, trudna do odtworzenia i w dużej mierze zależna od pamięci oraz osądu poszczególnych badaczy. Z nadejściem komputerów badacze zaczęli cyfryzować odbitki i stosować podstawowe zabiegi przetwarzania obrazu, takie jak zwiększanie kontrastu czy wykrywanie krawędzi. Te wczesne narzędzia ułatwiały oglądanie i udostępnianie kości, lecz traktowały znaki jedynie jako kształty, a nie znaczące pismo.
Uczenie głębokie wchodzi do archiwów
Pojawienie się uczenia głębokiego zmieniło krajobraz. Splotowe sieci neuronowe i transformatory, najpierw wytrenowane na zwykłych fotografiach, zostały przystosowane do wykrywania znaków na zaszumionych odbitkach, ich kategoryzowania, a nawet pomagania w dopasowywaniu połamanych fragmentów, które kiedyś należały do tej samej kości. Aby nakarmić te modele żądne danych, zespoły skompilowały dziesiątki wyspecjalizowanych zbiorów danych: jedne skupiały się na identyfikacji każdego znaku na odbitce, inne na klasyfikacji wykadrowanych glifów, łączeniu rdzeni i komponentów, czy parowaniu form starożytnych z późniejszymi skryptami. Dane odzwierciedlają jednak rzeczywistość historyczną: kilka powszechnych znaków pojawia się tysiące razy, podczas gdy wiele rzadkich lub nierozszyfrowanych znaków występuje tylko raz. Badacze odpowiadają sprytną augmentacją danych, modelami generatywnymi syntetyzującymi nowe przykłady oraz schematami treningowymi zaprojektowanymi tak, by rozpoznawać znaki na podstawie zaledwie kilku — lub żadnego — znanego próbki.
Nauczanie maszyn łączenia wizji ze znaczeniem
W najnowszej fazie adaptowane są duże modele multimodalne łączące wizję i język z myślą o kościach wróżebnych. Zamiast jedynie wskazywać, gdzie znajdują się znaki, systemy te próbują powiązać wygląd glifu z jego możliwym znaczeniem, podobnie jak robi to człowiek-paleograf. Nowe benchmarki sprawdzają, czy takie modele potrafią rozpoznawać znaki, scalać fragmenty, wyszukiwać podobne inskrypcje i sugerować prawdopodobne odczyty. Niektóre ramy próbują mapować znaki starożytne bezpośrednio na współczesne znaki chińskie, śledząc ewolucję wizualną na przestrzeni wieków; inne łączą znaki obrazkowe z fotografiami obiektów rzeczywistych; jeszcze inne podejmują się pełnych wyjaśnień tekstowych tego, co mogłaby mówić dana wróżbowa linia. Systemy w stylu agentów idą dalej, orkiestrując wiele narzędzi i baz danych, pomagając użytkownikom przeszukiwać obrazy, transkrypcje i notatki naukowe w jednym workflow.

Dane, ewaluacja i zagadka połamanej historii
Mimo szybkiego postępu przegląd uwypukla uporczywe przeszkody. Wiele najlepszych kolekcji zdjęć i skanów 3D znajduje się w muzeach lub prywatnych archiwach i nie jest publicznie dostępnych, co utrudnia porównywanie metod czy trenowanie naprawdę uniwersalnych modeli. Nawet publiczne zbiory często wykazują rozkłady klas z długim ogonem, niespójne etykiety lub niską jakość obrazów. Standardowe miary wydajności zapożyczone z wykrywania obiektów czy rozpoznawania pisma ręcznego mogą nie oddawać tego, co naprawdę ma znaczenie dla historyków — na przykład czy model myli dwie akceptowane warianty tego samego znaku, lub czy proponowany odczyt szanuje sposób, w jaki znak jest zbudowany z mniejszych części. Ewaluacja ludzka jest równie rozproszona: różne badania angażują różne typy ekspertów, zadają inne pytania i rzadko raportują na tyle szczegółowo, by inni mogli powtórzyć testy.
Gdzie starożytne pismo spotyka przyszłą SI
Aby pójść naprzód, autorzy postulują bogatsze, lepiej udokumentowane zbiory danych; metody ewaluacji, które premiują zrozumienie strukturalne i semantyczne, nie tylko dopasowania pikselowe; oraz bliższą współpracę między technologami a specjalistami od wczesnego pisma chińskiego. Wyobrażają sobie generatory tekst‑do‑obrazu potrafiące tworzyć realistyczne znaki w stylu kości wróżebnych na podstawie opisów, modele fundamentowe trenowane specjalnie na starożytnych pismach, systemy wieloagentowe debatujące i dopracowujące konkurujące odczyty, a nawet rekonstrukcje 3D przywracające pierwotny kształt połamanych kości. Mówiąc prosto, konkluzja artykułu brzmi, że SI nie „rozwiąże” kości wróżebnych sama — ale może stać się potężnym partnerem: wzmacniając wnikliwość ekspertów, udostępniając obszerne archiwa do wyszukiwania i otwierając głosy epoki brązu dla znacznie szerszej publiczności.
Cytowanie: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w
Słowa kluczowe: inskrypcje na kościach wróżebnych, starożytne chińskie pismo, humanistyka cyfrowa, sztuczna inteligencja, modele multimodalne