Clear Sky Science · pl

Wielowymiarowa fuzja cech tekstowych BA-RILA do rozpoznawania tematów starożytnej poezji chińskiej

· Powrót do spisu

Dlaczego warto uczyć komputery czytania starożytnych wierszy

Starożytne chińskie wiersze zawierają wieki emocji, historii i codziennego życia, lecz ich język jest tak odmienny od współczesnego chińskiego, że nawet eksperci spierają się o ich znaczenie. W miarę jak biblioteki i muzea digitalizują te dzieła, rośnie potrzeba inteligentnych narzędzi, które szybko posortują wiersze według tematów, pomagając naukowcom, studentom i opinii publicznej eksplorować ogromne zbiory. W tym badaniu przedstawiono nowy sposób, w jaki komputery mogą rozpoznawać, o czym mówi starożytny wiersz, wykorzystując nie tylko znaczenie słów, lecz także rytm i obrazowość, by lepiej uchwycić ducha klasycznego wiersza.

Przekształcanie klasycznych wierszy w dane

Aby nauczyć komputer poezji, badacze najpierw musieli zbudować odpowiedni zbiór danych. Zebrali około 10 000 wierszy z głównych chińskich dynastii, głównie z okresu Tang i Song, i starannie oznaczyli każdy z nich sześcioma szerokimi tematami, takimi jak przyjaźń i pożegnanie, historia i nostalgia, krajobrazy i wieś, miłość i małżeństwo, tęsknota za domem oraz pogranicze i wojna. Usunęli zakłócone lub niekompletne teksty, podzielili klasyczne teksty chińskie na segmenty i odfiltrowali słowa funkcyjne, które nie niosą dużo znaczenia. Analizy chmury słów wykazały, że każdy temat miał charakterystyczne słownictwo, co potwierdziło, że etykiety dobrze odpowiadają treściom poetyckim.

Figure 1. Jak AI sortuje duże zbiory starożytnej poezji chińskiej według znaczenia, brzmienia i obrazów.
Figure 1. Jak AI sortuje duże zbiory starożytnej poezji chińskiej według znaczenia, brzmienia i obrazów.

Łączenie znaczenia, brzmienia i obrazów

Większość technologii językowych skupia się wyłącznie na znaczeniu słów, ale klasyczna poezja chińska w dużym stopniu opiera się także na wzorcach dźwiękowych i symbolicznych obrazach. Nowy model BA-RILA łączy trzy rodzaje informacji. Po pierwsze, wykorzystuje wersję popularnego modelu językowego BERT, która została ponownie wytrenowana na języku starochińskim, aby komputer lepiej rozumiał starą gramatykę i klasyczne zwroty. Po drugie, mierzy rytm za pomocą jedenastu cech numerycznych, które uchwytują rym, długość wersów, wzory tonów i strukturę dwuwierszy, odzwierciedlając, jak wersy brzmią i równoważą się. Po trzecie, śledzi obrazowość poetycką przez 75-elementowy opis zbudowany na podstawie 25 kulturowo istotnych symboli, takich jak wierzby symbolizujące rozstanie czy księżyc symbolizujący tęsknotę, z informacjami o częstości, tonacji emocjonalnej i sile występowania w wierszu.

Jak model uczy się na całych wierszach

Te trzy strumienie informacji różnią się skalą, dlatego system najpierw mapuje je do wspólnej przestrzeni i używa wewnętrznego mechanizmu uwagi, by zdecydować, ile wagi nadać semantyce, rytmowi i obrazowości dla każdego wiersza. Zespolone cechy przechodzą następnie przez dwie warstwy dwukierunkowej sieci rekurencyjnej, która czyta wiersz zarówno od początku do końca, jak i odwrotnie, uchwytując, jak znaczenie rozwija się w czasie. Moduł uwagi wielogłowej dodatkowo wyróżnia najbardziej informatywne części tej reprezentacji, patrząc na nie z kilku perspektyw jednocześnie. Na koniec zestaw warstw w pełni połączonych przekształca ten bogaty obraz wewnętrzny w rozkład prawdopodobieństwa na sześć tematów, decydując, który temat najlepiej pasuje do wiersza.

Figure 2. Jak model AI krok po kroku łączy znaczenie, rytm i poetyckie obrazy, by określić temat pojedynczego wiersza.
Figure 2. Jak model AI krok po kroku łączy znaczenie, rytm i poetyckie obrazy, by określić temat pojedynczego wiersza.

Jak dobrze system działa

Obszerne testy pokazują, że BA-RILA wyraźnie przewyższa kilka silnych modeli referencyjnych opartych wyłącznie na współczesnym BERT, sieciach konwolucyjnych czy prostszych projektach rekurencyjnych. W zadaniu sześciotematycznym nowa metoda osiąga dokładność około 97 procent, z stabilnymi wynikami nawet dla rzadziej występujących tematów. Gdy autorzy usuwali poszczególne elementy systemu, takie jak dostrojony do starochińskiego BERT, fuzja rytmu i obrazowości, warstwy rekurencyjne czy moduł uwagi, wydajność wyraźnie spadała, co wskazuje, że każdy element wnosi istotny wkład. Model poradził sobie także z wierszami z okresu Tang i Song, choć miał nieco większe trudności z poezją Song, ponieważ jej rytmy są mniej regularne, a język bardziej rozproszony.

Co to oznacza dla eksploracji literatury klasycznej

Dla osób niebędących specjalistami kluczowy wniosek jest taki, że łączenie znaczenia słów z brzmieniem i symboliką pozwala komputerom sortować starożytne wiersze według tematów w sposób lepiej odzwierciedlający tradycyjne praktyki czytania. Zamiast traktować poezję jak zwykły tekst, podejście BA-RILA respektuje jej muzykalność i kulturową obrazowość, prowadząc do bardziej wiarygodnego automatycznego etykietowania. Takie narzędzia mogą ułatwić przeszukiwanie dużych archiwów, porównywanie poetów między dynastiami czy badanie, jak tematy takie jak tęsknota za domem lub wojna ewoluowały w czasie, wspierając zarówno badania naukowe, jak i publiczne docenienie klasycznej kultury chińskiej.

Cytowanie: Zhang, X., Liu, Y. Multi-dimensional text feature fusion-based BA-RILA for ancient Chinese poetry theme recognition. Sci Rep 16, 16573 (2026). https://doi.org/10.1038/s41598-026-48986-2

Słowa kluczowe: starożytna poezja chińska, klasyfikacja tematów, fuzja cech tekstowych, poetycka obrazowość, kulturowe NLP