Clear Sky Science · he
הדים של כוח: חקר הטיה גיאופוליטית במודלי שפה גדולים מארה"ב וסין
מדוע זה חשוב לקוראים יום-יומיים
כשאתה שואל צ'אטבוט בינה מלאכותית על אירועים עולמיים, ייתכן שתניח שהוא ניטרלי. המאמר הזה מראה שתשובות ממערכות מובילות המבוססות בארה"ב ובסין יכולות להטות בעדינות לכיוונים פוליטיים של מדינות המקור שלהן. הבנה כיצד הטיות נסתרות אלה נוצרות וכמה חזקות הן מסייעת לאזרחים, לעיתונאים ולמחוקקים להחליט מתי ניתן לסמוך על בינה מלאכותית ומתי ראוי להתייחס לדבריה בזהירות.
כיצד החוקרים בדקו את הצ'אטבוטים
המחברים השוו שני צ'אטבוטים מתקדמים: GPT-4o של OpenAI בארה"ב ו-DeepSeek-R1 של חברה סינית. הם בנו סט של 50 שאלות על פוליטיקה גלובלית, מלחמות, זכויות אדם ואזורים שנויים במחלוקת, המשקף את סוגי השאלות שאנשים מציפים ברשתות החברתיות ובפורומים מקוונים. כל השאלות נשאלו באנגלית דרך ממשקי האינטרנט הציבוריים של שתי המערכות, באמצעות פקודות פשוטות ובודדות בדומה לשימוש רגיל. מערך השאלות והתשובות המלא שותף באופן פתוח כדי לתמוך במחקרים עתידיים.
מה הם מדדו בתשובות
כדי לעבור מעבר להרשמות שטחיות, הצוות שילב ניתוח מספרי ובני אדם. ראשית, המירו כל תשובה לייצוג מספרי שתופס את משמעותה, ואז מדדו עד כמה שתי המערכות קרובות או רחוקות בכל שאלה. שנית, ביקשו מהמודלים לדרג עד כמה נקודות המבט של ארה"ב וסין עשויות לסטות זו מזו לגבי אותן שאלות. שלישית, בדקו את הטקסט ידנית, בחנו טון, בחירת דוגמאות ואילו עובדות הובלטו או הושמטו. תערובת הכלים הזאת אפשרה להם לזהות גם חילוקי דעות בוטים וגם שינויים עדינים בניסוח.
היכן הצ'אטבוטים הסכימו והיכן לא
להפתעה, שתי המערכות לעתים קרובות סיפקו תשובות דומות באופן רחב אפילו בנושאים רגישים כמו אחריות לאקלים, מוצא מגפת ה-COVID-19 או מורשת הנאציזם. שתיהן נטו להציג סקירות מאוזנות ולהימנע מטענות קיצוניות. עם זאת, עלו הבדלים מרכזיים. GPT-4o הציג מה שהמחברים מכנים הטיה מערבית "רכה", למשל בהדגשת ערכים של דמוקרטיה ליברלית או תפקידם של נאט"ו והאו"ם בהסברים שלו. DeepSeek, לעומת זאת, לעתים הדהד במישרין נרטיבים ממלכתיים סיניים ובמקרים מסוימים סירב להשיב על שאלות הנחשבות רגישות בסין, כגון מעמד טאיוואן או מחלוקות פנימיות ספציפיות. דחיות אלה הוצגו כחסימות קשיחות ברמת ממשק האינטרנט ולא כפשוטות כשיעורים בחסר של יכולת המודל. 
דחיפות נסתרות בצורה שבה מספרים סיפורים
המחקר מדגיש שההשפעה המדאיגה ביותר עשויה שלא להיות צנזורה גלויה אלא כיוון עדין. בחלק מהתשובות, שני המודלים הסכימו על עובדות בסיסיות אך ניסחו אותן באופן שונה: אחד עשוי להדגיש חירויות אישיות ותחרות בחירות, בעוד השני יבליט יציבות, ריבונות או רווחה קולקטיבית. לאורך זמן, הטיה רכה כזו יכולה לעצב מה שמרגיש "חשיבה מקובלת" עבור משתמשים הרואים בצ'אטבוט עוזר ניטרלי. מאחר שיותר ממחצית מבוגרי ארה"ב כבר משתמשים בכלים כאלה, ואנשים מבוגרים נחשבים לפגיעים יותר למידע מטעה, אפילו דחיפות קטנות וחוזרות עלולות להטות דעות ציבוריות לגבי מלחמות, סכסוכי סחר או זכויות אדם מבלי שהציבור ישים לב. 
מה משמעות הדבר לאנשים ולמדיניות
המחברים מסכמים ששני הצ'אטבוטים האמריקאי והסיני נושאים טביעות גיאופוליטיות, אך התנהגותם איננה מראה פשוטה של קווים ממשלתיים. אימון על נתונים עצומים ומעורבים מכל העולם נראה כמגביל שליטה אידאולוגית מוחלטת, ומוביל חברות להסתמך במקום זאת על חסימות נושאיות עבור הנושאים הרגישים ביותר. יחד עם זאת, נוכחותה של צנזורה קשיחה וניסוח רך מעלה שאלות לגבי אמון, שקיפות וסיכון לעיצוב דעות בקנה מידה רחב. עבור הקוראים, המסקנה ברורה: התייחסו לפלטי בינה מלאכותית על עניינים עולמיים כנקודת מבט אחת מתוך רבות, לא כמרכז אמת ניטרלי, ולצרפו שיקול דעת אנושי ומקורות מידע מגוונים.
ציטוט: Pacheco, A.G.C., Cavalini, A. & Comarela, G. Echoes of power: investigating geopolitical bias in US and China large language models. Humanit Soc Sci Commun 13, 675 (2026). https://doi.org/10.1057/s41599-026-06577-6
מילות מפתח: הטיה גיאופוליטית, מודלי שפה גדולים, ChatGPT, DeepSeek, תקשורת פוליטית