Clear Sky Science · he
זיהוי רמיזות בדיון הדיפלומטי הסיני והרוסי באמצעות מודלים שפתיים גדולים
לקרוא בין השורות
כשנציגים דיפלומטיים מדברים בפומבי, מה שהם לא אומרים יכול להיות חשוב לא פחות מהמילים שהם בוחרים. מחקר זה חוקר האם בינה מלאכותית מודרנית יכולה לזהות את הרמיזות העדינות והמסרים המוסוות בכנסי העיתונות של משרדי החוץ הסיניים והרוסיים — אותות שבני אדם לעתים קרובות מפספסים, אך שיכולים להשפיע על יחסים בינלאומיים.

מדוע רמיזות חשובות בעניינים עולמיים
שפה דיפלומטית מעוצבת להיות זהירה ומנומסת. ממשלות צריכות להגן על האינטרסים שלהן מבלי לעורר מתחרים או להלחיץ את הציבור בגלוי. כתוצאה מכך, נציגים לעתים מסתמכים על רמיזות — ביטויים שנשמעים ניטרליים במבט ראשון אך מבקרים, מזהירים או מסמנים עמדה פוליטית בעדינות. פרשנות שגויה של רמיזות כאלה תרמה בעבר למשברים וחוסר אמון בין מדינות. הבנת מסרים בלתי-ישירים קשה במיוחד מעבר לשפות ותרבויות, שבהן אי אפשר להניח ידע רקע משותף.
תיאוריה קלאסית למכונות חכמות
בעשרות השנים האחרונות בלשנים ופילוסופים חקרו כיצד הדוברים מרמזים יותר ממה שאומרים במובן המילולי. תיאוריות מוקדמות התמקדו בעיקר בכוונת הדובר ובהנחה כי מאזין רציונלי יכול לשחזר את המשמעות החבויה. עבודות מאוחרות יותר בתחום "הפרגמטיקה הקוגניטיבית" הדגישו שהבנת רמיזות תלויה גם בתהליכים מנטליים של המאזין, ברקע התרבותי ובהקשר המקיף. בהמשך רעיונות אלה מתארים המחברים רמיזות כשכבתיות: הניסוח הנראה (רמת מילים־משמעות), דרכי החשיבה המעוצבות תרבותית שמאחוריו (רמת לשונית־קוגניטיבית), ומניעי הדובר ואסטרטגיותיו כגון ביקורת, אזהרה או שמירת פנים (רמת מוטיבציונית־פרגמטית).
כיצד נבנה המערכת הממוחשבת
החוקרים אספו כמעט 1,400 מקטעי שאלה־תשובה מכנסים רשמיים של משרדי החוץ הסיניים והרוסיים שנערכו ב־2024. בלשנים מומחים תייגו ידנית 498 מקרים שבהם הדוברים רמזו במקום לדבר בגלוי. הם חלקו מקרים אלה לשלושה סוגים: "רמיזות קבועות" עם ניסוחים יציבים ומחזוריים (למשל נוסחי דיפלומטיה שגרתיים), "רמיזות תרבותיות" שמשמעותן נשענת על ידע ומטאפורות תרבותיות משותפות, ו"רמיזות הקשריות" שאותן ניתן לזהות רק באמצעות בדיקה מדוקדקת של המצב והמניעים המיידיים. דוגמאות אלה נוצלו לבניית בסיס ידע חיצוני ולתכנון מערך כללי היסק למודל שפתי גדול.
ללמד את המודל לחשוב בשלבים
הצוות שילב שתי טכניקות בינה מלאכותית. Retrieval-Augmented Generation (RAG) מאפשר למודל למשוך דוגמאות רלוונטיות מבסיס הנתונים המותאם כל אימת שהוא מעבד תשובה חדשה מכנס עיתונות. Chain-of-Thought (CoT) prompting מאלץ את המודל להסיק צעד אחר צעד: לזהות את השפה, לפצל את התשובה למשפטים, לבדוק דפוסי רמיזה מוכרים, להחליט האם משפט מבטא מוטיב מסוים (כגון ביקורת או אזהרה) באמצעות אסטרטגיה מזוהה (כגון הצהרה עובדתית, ניגוד או אירוניה), ולבסוף לסווגו כרמיזה קבועה, תרבותית, הקשרית או "ללא רמיזה." המערכת גם מבצעת בדיקה עצמית כדי לוודא שהמשמעות המרומזת שונה באמת מהניסוח המילולי.

כמה טוב זה עבד?
כדי לבחון את המערכת, המחברים השתמשו בנתוני כנסים חדשים משנת 2025 בשתי השפות. באופן כללי, המודל המוגבר הצליח בזיהוי מסרים מוסתרים: הוא תפס את רוב הרמיזות האמיתיות (רגש קליטה גבוה) והשיג איזון מכובד בין זיהוי יתר לבין החמצות (ציון F1 של 0.83 לרוסית ו־0.76 לסינית). הוא היה חזק במיוחד בזיהוי רמיזות קבועות בשתי השפות, תומך ברעיון כי דפוסים יציבים קלים יותר ללמידה על ידי מכונות. עם זאת, הוא התקשה יותר עם רמיזות תרבותיות והקשריות בסינית מאשר ברוסית. המחברים מקשרים פער זה להבדלים בסגנון: הדיבור הדיפלומטי הרוסי לעתים קרובות משתמש במטאפורות חיות וניגודים חדים שמסמנים ביקורת או אזהרה בצורה ברורה יחסית, בעוד שהדיסקורס הסיני נשען יותר על נוסחים ניטרליים, אידיומים ואדיבות התלויה בהקשר, שקשה יותר למודל להבחין בינם לבין הצהרות מילוליות.
מה הטעויות לומדות אותנו — ואיך לשפר
בחינה מעמיקה של השגיאות הראתה שלושה בעיות חוזרות. לפעמים המודל "קרא יותר מדי" בטקסט והמציא משמעויות חבויות שאינן קיימות. לפעמים זוהתה רמיזה אך סווגה באופן שגוי, טשטש את הגבול בין מקרים קבועים להקשריים. ולפעמים הוא פשוט התייחס לניסוח פשוט כרמיזה משום שמילות מפתח רגישות או דפוסים מוכרים הופיעו. כדי לטפל בחולשות אלה מציע המאמר להוסיף הרבה דוגמאות של נוסחי דיפלומטיה ברורים כ"ללא־רמיזה" כשליליות, לכפות על המערכת לעגן את המסקנות ביתר קשיחות לשאלה ולסביבה, להתאים משפטים מול בסיס הידע יותר מפעם אחת עם ניסוחים חלופיים, ולהוסיף שלב סינון והערכה עצמית שמבקש: האם זה כבר מפורש, או באמת מרומז?
מדוע זה חשוב עבורנו
ללא מומחים, המסקנה המרכזית היא שמודלים שפתיים גדולים כבר יכולים לסייע למנתחים למיין כמויות גדולות של הצהרות רשמיות ולסמן מקומות שבהם מדינות עשויות "לדבר בין השורות." יחד עם זאת, המחקר מדגיש עד כמה הדיפלומטיה תלויה בתרבות, היסטוריה וסגנון — גורמים שעדיין מאתגרים אף עבור בינה מלאכותית מתקדמת. על ידי מיזוג תיאוריה לשונית עם כלים מודרניים של בינה מלאכותית, עבודה זו מצביעה על מערכות אמינות יותר למעקב אחר אותות עדינים בפוליטיקה הגלובלית, אך מדגישה שגם שיפוט אנושי ומומחיות חוצת־תרבויות נותרות חיוניות לפרשנות של מה שנשאר לא נאמר.
ציטוט: Guo, Y., Wang, X. Hint recognition in Chinese and Russian diplomatic discourse using large language models. Sci Rep 16, 5751 (2026). https://doi.org/10.1038/s41598-026-36338-z
מילות מפתח: שפה דיפלומטית, משמעות מרומזת, מודלים שפתיים גדולים, ניתוח חוצה-שפות, יצירה בתמיכה בהוצאה לאחסון (RAG)