Clear Sky Science · he

מודל עולמי לניתוח סנטימנט בטוויטר לגבי חיסוני COVID

· חזרה לאינדקס

מדוע רגשות לגבי חיסונים בטוויטר חשובים

במהלך מגפת COVID-19, ממשלות נסמכו על חיסונים ושיתוף הציבור להצלת נפשות. עם זאת, אנשים ברחבי העולם הגיבו באופן שונה מאוד לקמפייני החיסון, לעתים מבטאים את תקוותיהם ופחדיהם ברשתות החברתיות. המחקר הזה בוחן מעבר לתוויות פשוטות של "חיובי" או "שלילי" בציוצים ושואל שאלה עמוקה יותר: כיצד נראים ההערות של אנשים על חיסון COVID-19 ברגע שמביאים בחשבון כמה המדינה שלהם הושפעה מהווירוס? על ידי שילוב טקסט הציוץ עם נתוני המגפה בעולם האמיתי, מחברי המחקר שואפים ללכוד מה משמעות ההודעה בהקשרה הגלובלי הרחב יותר.

מציוצים גולמיים לתחושות ראשוניות

החוקרים התחילו באיסוף למעלה מארבעים אלף ציוצים באנגלית על חיסון COVID-19 שפורסמו באביב 2021, תקופה מכרעת שבה מדינות רבות הגיעו לאבני דרך משמעותיות בחיסונים. הם ניקו את הנתונים על ידי הסרת תוויות למשתמשים וקישורי רשת שאינם תורמים לשיפוט הטון. כדי להקצות סנטימנט ראשוני לכל ציוץ השתמשו במודל שפה מודרני שאומן במיוחד על תוכן מטוויטר, הידוע בשם Twitter-roBERTa. מודל זה ממיין ציוצים לשלוש קטגוריות בסיסיות: חיובי, שלילי או ניטרלי, בהתבסס טהור על הטקסט. המחברים קוראים לשכבת התיוג הראשונית הזאת "סנטימנט מקומי" של הציוץ, משום שהיא מתעלמת ממה שקורה בשאר העולם.

Figure 1
Figure 1.

הוספת מצב המגפה בעולם האמיתי

לאחר מכן הקבוצה אספה סטטיסטיקות ברמת מדינה לגבי COVID-19 — ספירת מקרים, תמותה ואוכלוסייה — עבור עשר מדינות המפוזרות בצפון אמריקה, אירופה, אסיה ואוקיאניה. הם המירו מספרים אלה לערך יחיד של "חומרה" לכל מדינה, המראה כמה היא הושפעה יחסית לאחרות בתקופת המחקר. ציוץ שמקורו במדינה עם שיעורי מקרים ותמותה גבוהים נקרא אפוא באור שונה מאוד מציוץ זהה במדינה שבה המצב קל יותר. החוקרים אז מיזגו כל ציוץ עם ערך החומרה של המדינה שממנו הוא כנראה הגיע, תוך שימוש במיקומים שדווחו על ידי המשתמשים וברשימות מעודנות של ערים ואזורים כדי למפות מיקומים למדינות.

מהפיכת תחושות מקומיות לגוונים גלובליים של דעה

עם טקסט הציוץ וההקשר המדינתי ביד, המחברים תיכננו שלוש שיטות לדייק את תווית הציוץ מתווית פשוטה של חיובי/שלילי/ניטרלי אל "סנטימנט גלובלי" עשיר יותר. שתי השיטות הראשונות משתמשות בכללי הסתברות (תיאורמת בייז) כדי למדוד כמה נפוץ כל סוג סנטימנט בתוך מדינה או בתוך שתי קבוצות רחבות של מדינות: אלה שנמצאות במצב מגפה יחסית "טוב" מול "רע". ציוץ שמתנגש עם המצב הרוח השורר בסביבתו, כגון הערה חיובית נדירה במדינה שנפגעה קשה, מטופל כביטוי "עצמה גבוהה", בעוד ציוץ שמשקף דעה שכיחה מטופל כ"עצמה נמוכה". שיטה 2 גם מבחינה בין תוויות חיוביות או שליליות "חלשות" ו"חזקה", בהתאם לשאלה האם טון הציוץ מתאים או מנוגד למצב המדינה.

Figure 2
Figure 2.

מודל חכם יותר ללמוד עוצמה באופן אוטומטי

השיטה השלישית משתמשת בגישה סטטיסטית מתקדמת יותר הנקראת רגרסיה סדרתית רב-רמתית בייזיאנית. במקום להסתמך על סף קבוע, מודל זה לומד מהנתונים עצמם כיצד ציוני הסנטימנט ברמת הציוץ (נגזרים מההסתברויות של Twitter-roBERTa) מתקשרים עם חומרת המגפה בכל מדינה. הוא לוקח בחשבון הבדלים בין מדינות ובו־בזמן מאגד מידע מהן. המודל מעריך אז, עבור כל ציוץ, לא רק האם הוא שלילי, ניטרלי או חיובי, אלא גם עד כמה בביטחון ניתן לשייך אותו לקטגוריה זו. ציוצים שההסתברויות המבוססות-מודל שלהם גבוהות מהרגיל לקטגוריה שלהם מתויגים כ"עצמה גבוהה"; אחרים מסומנים כ"עצמה נמוכה". זה יוצר תוויות סנטימנט גלובליות מעודנות המשקפות גם שפה וגם הקשר בריאותי-ציבורי.

מה משמעות המסקנות להבנת מצב הרוח הציבורי

כאשר המחברים השתמשו בתוויות הסנטימנט הגלובליות החדשות האלה לאימון מסווגי למידת-מכונה נפוצים, הם גילו שהתוויות המפורטות — במיוחד אלה שנוצרו על ידי המודל המתקדם — סייעו למסווגים ללמוד דפוסים מדויקים יותר מאשר השיטות הפשטניות יותר. במונחים מעשיים, משמעות הדבר היא שסוכנויות בריאות הציבור, חוקרים ואנליסטים של מדיה חברתית יכולים לקבל תמונה חדה יותר של מה אנשים באמת מרגישים לגבי חיסונים כאשר מסתכלים על ציוצים בעדשה גלובלית ולא רק על המילים בבידוד. שני אנשים עשויים להישמע באותה מידה מתוסכלים לגבי חיסון, אך אם האחד חי במדינה המתמודדת עם התפרצות קשה והשני במקום שבו המצב תחת שליטה, למסרים שלהם משקל שונה. על ידי לכידת הבדלים אלה בעצמה, המחקר מציע דרך מעוגנת יותר לנטר את הסנטימנט הציבורי ולעצב תגובות שתואמות טוב יותר את המציאות שאנשים חווים.

ציטוט: Chakrabarty, D., Chatterjee, S. & Mukhopadhyay, A. A global twitter sentiment analysis model for COVID-vaccination. Sci Rep 16, 9005 (2026). https://doi.org/10.1038/s41598-026-38553-0

מילות מפתח: חיסון COVID-19, סנטימנט בטוויטר, ניתוח מדיה חברתית, תקשורת בריאות הציבור, למידת מכונה