Clear Sky Science · pl
Rozpoznawanie aluzji w dyskursie dyplomatycznym chińskim i rosyjskim z wykorzystaniem dużych modeli językowych
Czytać między wierszami
Kiedy dyplomaci przemawiają publicznie, to, czego nie mówią, może mieć równie duże znaczenie co dobór słów. Badanie to analizuje, czy nowoczesna sztuczna inteligencja potrafi wychwycić subtelne aluzje i zakamuflowane przesłania w konferencjach prasowych ministerstw spraw zagranicznych Chin i Rosji — sygnały, które ludzie często przeoczają, a które mogą wpływać na stosunki międzynarodowe.

Dlaczego aluzje mają znaczenie w sprawach światowych
Język dyplomatyczny jest projektowany tak, by być ostrożnym i uprzejmym. Rządy muszą bronić swoich interesów, nie prowokując otwarcie rywali ani nie niepokojąc opinii publicznej. W rezultacie urzędnicy często polegają na aluzjach — zwrotach, które na pierwszy rzut oka brzmią neutralnie, lecz po cichu krytykują, ostrzegają lub sygnalizują stanowisko polityczne. Błędna interpretacja takich aluzji przyczyniła się w przeszłości do kryzysów i braku zaufania między państwami. Zrozumienie tych pośrednich komunikatów jest szczególnie trudne w przekroju języków i kultur, gdzie wspólna wiedza kontekstowa nie może być przyjęta za pewnik.
Od klasycznej teorii do inteligentnych maszyn
Przez dekady językoznawcy i filozofowie badali, jak mówiący sugerują więcej niż wynika z dosłowności wypowiedzi. Wczesne teorie koncentrowały się głównie na intencjach mówiącego i zakładały, że racjonalny słuchacz potrafi rekonstruować ukryte znaczenie. Późniejsze prace w obszarze „pragmatyki poznawczej” podkreślały, że rozumienie aluzji zależy też od procesów poznawczych słuchacza, jego tła kulturowego i kontekstu sytuacyjnego. Autorzy opisują aluzje jako warstwowe: widoczne brzmienie (poziom werbalno-semantyczny), kulturowo uformowane sposoby myślenia stojące za nim (poziom lingwistyczno-poznawczy) oraz motywy i strategie mówiącego, takie jak krytyka, ostrzeżenie czy ratowanie twarzy (poziom motywacyjno-pragmatyczny).
Jak zbudowano system AI
Badacze zebrali niemal 1 400 segmentów pytanie–odpowiedź z oficjalnych konferencji prasowych ministerstw spraw zagranicznych Chin i Rosji, które odbyły się w 2024 roku. Eksperci językoznawcy ręcznie oznaczyli 498 przypadków, w których rzecznicy posługiwali się aluzjami zamiast mówić wprost. Podzielili je na trzy typy: „stałe aluzje” o stabilnym, powtarzalnym brzmieniu (np. standardowe formuły dyplomatyczne), „aluzje kulturowe”, których znaczenie opiera się na wspólnej wiedzy kulturowej i metaforach, oraz „aluzje kontekstowe”, rozpoznawalne jedynie przez uważne spojrzenie na bezpośrednią sytuację i motywy. Przykłady te posłużyły do zbudowania zewnętrznej bazy wiedzy oraz zaprojektowania zestawu reguł wnioskowania dla dużego modelu językowego.
Nauczanie modelu rozumowania krok po kroku
Zespół połączył dwie techniki AI. Retrieval-Augmented Generation (RAG) pozwala modelowi pobierać odpowiednie przykłady z dedykowanej bazy aluzji przy przetwarzaniu nowej odpowiedzi z konferencji prasowej. Chain-of-Thought (CoT) prompting wymusza na modelu rozumowanie krok po kroku: zidentyfikować język, podzielić odpowiedź na zdania, sprawdzić znane wzorce aluzji, zdecydować, czy zdanie wyraża konkretny motyw (np. krytykę lub ostrzeżenie) za pomocą rozpoznanej strategii (np. stwierdzenie faktu, kontrast czy ironia), i wreszcie oznaczyć je jako aluzję stałą, kulturową, kontekstową lub „brak aluzji”. System wykonuje też kontrolę własną, aby upewnić się, że sugerowane znaczenie rzeczywiście różni się od dosłownego brzmienia.

Jak dobrze to działało?
Aby przetestować system, autorzy wykorzystali nowe dane z konferencji prasowych z 2025 roku w obu językach. Ogólnie rzecz biorąc, ulepszony model w wiarygodny sposób wykrywał ukryte przesłania: wychwytywał większość rzeczywistych aluzji (wysoka czułość) i osiągał przyzwoitą równowagę między wykrywaniami a nadinterpretacją (miara F1: 0,83 dla języka rosyjskiego i 0,76 dla chińskiego). Szczególnie dobrze radził sobie ze stałymi aluzjami w obu językach, co wspiera tezę, że stabilne wzorce są najłatwiejsze do opanowania przez maszyny. Miał jednak większe trudności z chińskimi aluzjami kulturowymi i kontekstowymi niż z rosyjskimi. Autorzy wiążą tę różnicę ze stylem: rosyjska mowa dyplomatyczna często używa barwnych metafor i ostrych kontrastów, które wyraźnie sygnalizują krytykę lub ostrzeżenie, podczas gdy chiński dyskurs częściej opiera się na neutralnych formułach, idiomach i uprzejmości zależnej od kontekstu, które trudniej odróżnić od wypowiedzi dosłownych.
Co ujawniają błędy — i jak je poprawić
Analiza pomyłek ujawniła trzy powtarzające się problemy. Czasem model „przeczytał za dużo”, dopisując ukryte znaczenia tam, gdzie ich nie było. Innym razem wykrywał aluzję, ale przypisywał jej niewłaściwy typ, zacierając granicę między przypadkami stałymi a kontekstowymi. Bywało też, że traktował zwykłe sformułowanie jako aluzję, bo występowały w nim pewne wrażliwe słowa lub znane wzorce. Aby zaradzić tym słabościom, artykuł sugeruje dodanie wielu jasnych przykładów „bez aluzji” jako negatywnych przykładów, zmuszenie systemu do silniejszego ugruntowania wniosków w rzeczywistym pytaniu i otaczającym kontekście, porównywanie zdań z bazą wiedzy wielokrotnie z użyciem przepisów/zredagowań oraz wprowadzenie kroku wstępnego filtrowania i samooceny z pytaniem: czy to już jest jawne, czy naprawdę jest ukryte?
Dlaczego to ma znaczenie dla nas wszystkich
Dla osób spoza specjalizacji najważniejsze jest to, że duże modele językowe już mogą pomagać analitykom przesiać duże ilości oficjalnych oświadczeń i wskazać miejsca, gdzie rządy mogą mówić między wierszami. Jednocześnie badanie uwypukla, jak bardzo dyplomacja zależy od kultury, historii i stylu — czynników, które pozostają wyzwaniem nawet dla zaawansowanej AI. Łącząc teorię językową z nowoczesnymi narzędziami AI, praca ta wskazuje drogę ku bardziej wiarygodnym systemom śledzenia subtelnych sygnałów w polityce światowej, jednocześnie jasno pokazując, że ludzki osąd i kompetencje międzykulturowe wciąż są niezbędne do interpretacji tego, co pozostaje niewypowiedziane.
Cytowanie: Guo, Y., Wang, X. Hint recognition in Chinese and Russian diplomatic discourse using large language models. Sci Rep 16, 5751 (2026). https://doi.org/10.1038/s41598-026-36338-z
Słowa kluczowe: język dyplomatyczny, ukryte znaczenie, duże modele językowe, analiza międzyjęzykowa, generowanie wspomagane przez wyszukiwanie