Clear Sky Science · he
ChunkyBERT: טכניקה חדשה לגילוי הטיה פוליטית רב-מעמדית בתקשורת החדשותית
מדוע נטיות נעלמות בחדשות חשובות
כל יום אנשים גוללים כותרות פוליטיות בלי להבין כיצד ניסוח ובחירות סיפוריות עשויים בשקט לכוון את עמדותיהם. מחקר זה מציג את ChunkyBERT, מודל מחשב שנועד לזהות האם מאמר חדשות פוליטי ארוך נוטה שמאלה, למרכז או ימינה, תוך שימוש בטקסט המלא במקום בכמה רמזים שבחרו ביד. המטרה היא לסייע לקוראים, לעיתונאים ולגופים מבקרים לראות הטיה בצורה ברורה יותר בתקשורת הדיגיטלית המודרנית.
כיצד נטייה פוליטית מעצבת את מה שאנחנו קוראים
אתרי חדשות יכולים להשפיע על דעת הקהל לא רק במה שהם אומרים, אלא גם במה שהם משאירים מחוץ לכך, איך הם ממסגרים אירועים, ואילו ביטויים רגשיים הם בוחרים. בעידן הפלטפורמות המקוונות זה יכול להעמיק פילוגים, להאכיל תאי הדדה ולהפיץ מידע מטעה. כלים ממוחשבים קודמים ניסו למדוד זאת על ידי ספירת מילים חיוביות או שליליות, או מעקב אחרי תדירות הופעת מונחים מסוימים. למרות זאת, כלים אלה נאבקו בהבנת ההקשר, כגון סרקזם או מסגור עדין, ולעתים דרשו הרבה עבודה ידנית של מומחים.
מרמזים בעבודת יד לקריאה של הטקסט המלא
התקדמות אחרונה בטכנולוגיית שפה מאפשרת למודלים ללמוד משמעות ישירות מטקסט גולמי. מערכות מבוססות רשתות עצביות וטרנספורמרים, כמו BERT, יכולות ללכוד כיצד מילים משפיעות זו על זו במשפט ובין פסקאות. מחקרים רבים השתמשו בכלים אלה לזיהוי דיבור שנוא, חדשות מזויפות או זיהוי סנטימנט, וחלקם ניסו להעריך נטייה פוליטית מכותרות קצרות או ציוצים. עם זאת, מאמרים פוליטיים ארוכים נותרו אתגר, כי למודלים סטנדרטיים יש מגבלות על כמות הטקסט שהם יכולים לקרוא בבת אחת, וסימני הטיה עשויים להיות פזורים לאורך הסיפור במקום להופיע בציטוט חד וברור.

שבירת מאמרים ארוכים לחתיכות קלות יותר
ChunkyBERT מתמודד עם הבעיה על ידי חיתוך כל מאמר ארוך לחתיכות קטנות ואחידות באורכן, הנקראות חתכים (chunks). חתכים אלה אינם מיושרים למשפטים או פסקאות, מה שמשמר את התהליך פשוט וצפוי עבור המחשב. כל חתך מועבר למודל שפה מאומן מראש שממפה מילים לתבניות מספריות שמייצגות את משמעותן בהקשר. שכבת טרנספורמר נוספת מלטשת תבניות אלו, וצעד של תשומת לב מאפשר למערכת להדגיש בשקט את המילים והביטויים שנראים כמגלים ביותר את הנטייה הפוליטית בעוד שמטהים טקסט רקע נייטרלי.
להחזיר את הסיפור יחד
לאחר כל חתך מסוכם בצורה הזו, ChunkyBERT מממץ את סיכומי החתכים למעין טביעת אצבע כוללת של המאמר. טביעת אצבע זו מועברת לשכבת החלטה סופית שמחליטה בין שמאל, מרכז או ימין. החוקרים אימנו ובחנו את המערכת על יותר מ-37,000 מאמרי חדשות עם תוויות פוליטיות ידועות, בעיקר ממקורות בארצות הברית. הם השוו את ChunkyBERT לשיטות למידת מכונה מסורתיות ולמודלים עצביים אחרים, כולל כאלה המבוססים על רשתות חזרתיות וקונבולוציות טמפורליות, הן עם חיתוך והן בלי, וכאמור — גם עם מנגנון תשומת לב.

עד כמה המערכת מתפקדת היטב
הניסויים הראו כי ChunkyBERT סיווג מאמרים בדיוק אימות של כ-86 אחוזים והשיג ציון חזק במדד הפרדה סטנדרטי שבודק כמה טוב הוא מבחין בין המעמדות. המערכת הצטיינה במיוחד בזיהוי קטעים נטויי-שמאל או נטויי-ימין ברורים, בעוד שמאמרים מרכזיים לעתים הוסבו בשגגה לאחת הצדדים, מה שמשקף את הטון המעורב יותר שלהם. מחקר של א-בלציה, שבו החוקרים כיבו חלקים מהמודל, גילה שגם החיתוך של מסמכים ארוכים וגם שכבות הטרנספורמר היו קריטיות להשגת ביצועים גבוהים. המערכת גם עלתה על שיטות גילוי הטיה קודמות שנבחנו על אותו מאגר נתונים.
מה המשמעות עבור קוראי חדשות
במילים פשוטות, ChunkyBERT מתנהג כמו קורא זהיר ובלתי עייף שמסרק סיפורים פוליטיים בשלמותם ומעריך היכן הם ממוקמים על הספקטרום הפוליטי. הוא לא מסיר הטיה מהחדשות, ולא קובע אילו עמדות “נכונות”, אך יכול לסייע לסמן נטיות שעשויות להישאר בלתי נודעות אחרת. עם שיפור והתאמה לשפות ואזורים אחרים, כלים דומים יכולים לתמוך במעקב תקשורתי, בדיוני כיתה ובפלטפורמות אוריינות דיגיטלית, ולהעניק לאנשים תמונה ברורה יותר של איך מידע מעוצב לפני שהוא מגיע למסכים שלהם.
ציטוט: Loiya, D., Kulal, S.S., Reddy, M.S.M. et al. ChunkyBERT: a novel technique for multiclass political bias detection in news media. Sci Rep 16, 15323 (2026). https://doi.org/10.1038/s41598-026-46646-z
מילות מפתח: הטיה בתקשורת פוליטית, מיון חדשות, מודלים מבוססי טרנספורמר, BERT, אוריינות דיגיטלית