Clear Sky Science · pl
OBI designer: generowanie artystycznych znaków pism z wyroczni metodą zero-shot z multimodalnym transferem stylu
Ożywianie starożytnych symboli
Ponad trzy tysiące lat temu w Chinach ludzie wykuwali pytania do bogów na skorupach żółwi i kościach zwierząt. Symbole, których używali — znane jako inskrypcje wyroczni — są najstarszą znaną formą pisma chińskiego i mają uderzającą, obrazową urodę. Dziś artyści i projektanci chcą wykorzystywać te kształty w logotypach, plakatach, grach i produktach kulturowych — ale ręczne tworzenie takich projektów jest powolne i wymaga rzadkiej specjalistycznej wiedzy. W artykule przedstawiono system sztucznej inteligencji o nazwie OBI-Designer, który automatycznie przekształca te starożytne znaki w nowe, ekspresyjne dzieła sztuki, zachowując ich rozpoznawalność i szacunek dla pochodzenia. 
Dlaczego te starożytne znaki mają znaczenie
Inskrypcje wyroczni to nie tylko dawne pismo; każdy znak jest małym obrazkiem sugerującym znaczenie — płomień dla „ogień”, zwierzę dla „koń”, stylizowana twarz dla części ciała. Dzięki temu obrazowemu charakterowi stanowią bogate źródło dla współczesnego projektowania wizualnego, kaligrafii i brandingu kulturowego. Jednak napotykają kilka przeszkód. Cyfrowe wersje znaków są ograniczone, co utrudnia trening dużych modeli AI. Gdy artyści zbyt mocno zmieniają kształty, znaki tracą autentyczność historyczną i stają się nieczytelne. A „uczucie artystyczne” jest subiektywne, co utrudnia jego pomiar i automatyzację. Autorzy dążą do rozwiązania tych trzech problemów jednocześnie: chcą systemu, który potrzebuje niewiele danych, chroni czytelność i jednocześnie pozwala na odważną kreatywność wizualną.
Budowanie lepszego cyfrowego alfabetu
Pierwszym krokiem jest stworzenie precyzyjniejszej cyfrowej wersji znaków wyroczni. Istniejące czcionki komputerowe opisują każdy glif tylko kilkoma punktami kontrolnymi, co utrudnia ich płynne przekształcanie. Badacze starannie przetworzyli komercyjną czcionkę inskrypcji wyroczni tak, aby każdy znak został odbudowany z wielu małych krzywych. Adaptacyjny algorytm dodaje dodatkowe punkty tylko tam, gdzie są one najbardziej potrzebne — na ostrych narożnikach lub zakrętach — bez zaśmiecania prostych obszarów. Efektem jest nowy zbiór danych, w którym każdy znak jest przechowywany jako elastyczny obrys, mogący się zginąć i rozciągać w sposób płynny. Podstawa geometryczna pozwala systemowi AI zmieniać kształty w subtelny, kontrolowany sposób zamiast losowo je deformować.
Od prostego obrysu do inteligentnego kształtu
OBI-Designer następnie przekształca te obrysy, by oddać znaczenie wybranego słowa lub frazy. W pierwszym etapie, zwanym syntezą glifu, system pobiera znak bazowy i tekstowy prompt typu „głowa psa”. Renderuje obrys jako obraz, wprowadza go do potężnego modelu generowania obrazów i pyta: „Jak wyglądałoby zdjęcie pasujące do tej frazy?” Zamiast pozwolić modelowi wymyślić zupełnie nowy obraz, system wykorzystuje wewnętrzne sygnały modelu jako delikatne wskazówki do popychania punktów kontrolnych oryginalnego znaku. Dodatkowe reguły działają jak poręcze: jedna ogranicza zmianę kątów małych trójkątów wewnątrz obrysu, a inna zachowuje szeroki wzór jasności i cienia znaku. Razem te ograniczenia pozwalają glifowi przyjąć nowe, semantycznie istotne cechy — uszy, ogony czy płomienie — pozostając jednocześnie strukturalnie wystarczająco blisko, by czytać go jako ten sam starożytny symbol.
Malowanie faktury bez utraty kreski
W drugim etapie, zwanym syntezą tekstury, OBI-Designer skupia się na stylu powierzchni. Najpierw odrysowuje udoskonalony obrys, by uchwycić kluczowe pociągnięcia i krawędzie. Specjalistyczna sieć używa tej mapy krawędzi jako planu, upewniając się, że każdy generowany obraz ściśle trzyma się oryginalnej struktury. Na to nakłada się lekka technika, która dopasowuje tylko niewielki wycinek modelu obrazowego, dzięki czemu może on nauczyć się konkretnych wyglądów — takich jak papierowy wycinanek, kaligrafia pędzla i tuszu, rzeźba w drewnie, neonowy blask czy graffiti — bez ponownego trenowania całego systemu. Końcowy efekt łączy ostre, wierne linie z bogato zróżnicowanymi powierzchniami, dając projektantom zestaw stylów rodzących się z tych samych historycznych korzeni. 
Testowanie urody i czytelności
Aby sprawdzić, czy te dzieła nadal „czyta się” jako znaki wyroczni, autorzy poddają je systemowi komputerowemu wyszkolonemu do rozpoznawania oryginalnych inskrypcji. System poprawnie identyfikuje wygenerowane przez AI znaki prawie w 94 procentach przypadków, tylko nieznacznie poniżej swojej dokładności dla nienaruszonych oryginałów. Ochotnicy z pewną znajomością starożytnego pisma także oceniają nowe znaki wyżej niż te z kilku konkurencyjnych metod, uznając je za bardziej strukturalnie kompletne, semantycznie trafne i wizualnie atrakcyjne. Dalsze eksperymenty ukazują delikatną równowagę: dodanie większej liczby punktów kontrolnych pozwala systemowi przesuwać projekty w stronę bardziej dramatycznych, obrazowych form, ale zbyt wiele punktów zmniejsza czytelność maszynową. Ten kompromis daje użytkownikom jasny regulator do wyboru między czytelnością a swobodą artystyczną.
Nowa sztuka ze starych kości
W prostych słowach OBI-Designer to inteligentny asystent przekształcania jednych z najstarszych znaków pisma ludzkości w świeżą, nowoczesną sztukę. Szanuje podstawowe kształty, które czynią inskrypcje wyroczni historycznie znaczącymi, jednocześnie wykorzystując zaawansowane modele obrazowe do proponowania nowych form i faktur. Autorzy podkreślają, że takie narzędzia powinny wyraźnie oznaczać swoje rezultaty jako wygenerowane przez AI, aby uniknąć pomyłek z autentycznymi znaleziskami archeologicznymi. W przyszłości ta sama metoda może pomóc ożywić inne starożytne pismo, oferując muzeom, edukatorom i twórcom sposób świętowania dziedzictwa kulturowego poprzez żywe, ewoluujące projektowanie wizualne zamiast zamykania go w archiwach.
Cytowanie: Zhang, J., Deng, F., Yuan, J. et al. OBI designer: zero-shot oracle bone inscription artistic characters generation with multimodal style transfer. npj Herit. Sci. 14, 152 (2026). https://doi.org/10.1038/s40494-026-02417-7
Słowa kluczowe: inskrypcje wyroczni, generowanie tekstu artystycznego, dziedzictwo kulturowe, modele dyfuzyjne, stylizacja kroju pisma