Clear Sky Science · he

גישה רב‑מודלית לזיהוי חדשות כזב וצמתים משפיעים בהפצתן בעזרת למידה עמוקה וניתוח רשתות

· חזרה לאינדקס

מדוע זה חשוב לחיי היומיום

יום‑יום, מיליוני אנשים גוללים ברשתות חברתיות וצופים בפוסטים על בריאות, פוליטיקה, כסף ועוד. מעורב במידע מועיל ישנם גם שמועות וחדשות כזב שעלולות לעורר פחד, בלבול ואפילו נזק במציאות. המחקר הזה מציג דרך עוצמתית לעשות שתי משימות במקביל: ראשית, לזהות באופן אוטומטי פוסטים כוזבים או מטעהים; ושנית, למפות מי אחראי ביותר להפצתם בקהילה מקוונת. העבודה מתמקדת במסרי טוויטר על Covid‑19, אבל הרעיונות יכולים לסייע לפלטפורמות, לעיתונאים ולציבור להגיב במהירות ובדיוק רב יותר למידע מטעה מזיק בתחומים רבים בחיים.

Figure 1
Figure 1.

איך שמועות מתפשטות בתוך קהלים מקוונים

רשתות חברתיות כמו טוויטר, פייסבוק או אפליקציות מסרים נחשבות לרשתות ענק של אנשים (צמתים) המקושרים על‑ידי אינטראקציות (קישורים). כאשר משתמש מפרסם הודעה ואחרים משיבים או משתפים אותה, המידע יכול להדהד במהירות ברשת. שמועות — טענות בלתי מאומתות או כזביות — מתנהגות בדומה למחלות מדבקות: הן יכולות לעבור מאדם לאדם, לגלוש במהירות ולהיות קשות לעצירה. מחקרים קודמים נטו לטפל בשני השאלות בנפרד: כיצד לזהות האם פוסט נתון הוא שמועה, וכיצד למצוא את ה”מפיצים” המרכזיים שעוזרים לשמועה להגיע להרבה אנשים. המחברים טוענים כי התמודדות משולבת עם שתי השאלות, לצד התחשבות באופן שבו הרשת מחוברת וכיצד הפעילות משתנה עם הזמן, מספקת תמונה ברורה הרבה יותר של אופן התנועה של סיפורים שגויים.

לאמן מחשב לקרוא ולהסמן פוסטים חשודים

החלק הראשון של השיטה מתמקד בתוכן כל ציוץ. החוקרים מתייחסים לכל ציוץ כמסמך קצר ומנקים אותו על‑ידי הסרת רעשי רקע כמו סמלים מיותרים, החלפת קישורים וכתובות דוא"ל בתגיות פשוטות, והסרת מילים מילוי נפוצות שמוסיפות מעט משמעות. הם לאחר מכן ממירים כל מילה לווקטור מספרי באמצעות טכניקה ידועה בשם GloVe, אשר לוכדת כיצד מילים נוטות להופיע יחד בקבוצות טקסט נרחבות. על‑ידי ממוצע וקטורי המילים, כל ציוץ הופך לסיכום מספרי קומפקטי של המשמעות שלו. סיכומים אלה מוזנים לרשת עצבית קונבולוציונית חד‑ממדית — סוג של מודל למידה עמוקה היכול לזהות דפוסים עדינים — כדי להחליט האם ציוץ הוא הודעה אותנטית או שמועה.

מציאת המפיצים המרכזיים בתוך הרשת

לאחר שהמערכת הפרידה ציוצי שמועה מציוצים אמיתיים, החלק השני של הגישה פונה למבנה הרשת החברתית עצמה. כל משתמש הוא נקודה בגרף מכוון ומשוקלל, וכל תגובה או ריטוויט הופכים לקישור שעוצמתו משקפת כמה פעמים משתמש מגיב להודעות של אחר. באמצעות מידע זה, המחברים קודם כל מקבצים משתמשים לקהילות — קבוצות שמתקשרות יותר ביניהן מאשר עם חיצוניים — על‑ידי בניית ייצוג עץ מיוחד של הרשת ולאחר מכן מיזוג תת‑קבוצות קרובות בהתבסס על מידת ההתאמה ביניהן. בתוך הקהילות האלה הם מחשבים כמה תדיר כל משתמש נמצא על המסלולים החשובים ביותר בין אחרים, מדד הידוע בשם ביטווין (betweenness). משתמשים המופיעים שוב ושוב על מסלולים בעלי ערך גבוה מטופלים כמפיצים משפיעים. משקלי הקשרים מעודכנים אז כדי לשקף גם את תדירות האינטראקציות וגם את המרכזיות של המשתמשים המחוברים, וחשיפת הנתיבים הסבירים ביותר ששמועות נוטות לקחת דרך הרשת לאורך הזמן.

Figure 2
Figure 2.

מה חשף מקרה המבחן של Covid‑19

כדי לבדוק את המסגרת שלהם, החוקרים יישמו אותה על מאגר טוויטר עצום על Covid‑19: כמעט 100 מיליון ציוצים שמעורבים בהם יותר מ‑150,000 משתמשים, שממנו חילצו מעל 14,000 הודעות ייחודיות מתויגות כמידע אותנטי או כשמועות. על נתונים אלה, מודל הלמידה העמוקה שלהם סווג נכון כ־99 אחוז מהציוצים, והצטיין על פני מספר שיטות קיימות, כולל גלאים מתקדמים אחרים לחדשות כזב. בשלב השני הם השוו את רשימת המשתמשים המשפיעים שלהם עם מודל מתמטי ידוע להתפשטות מידע, ומצאו את ההסכמה הגבוהה ביותר בין השיטות שנבדקו. הם גם הראו שכאשר נתחו תקופות זמן ארוכות יותר — 120, 240 ואז 360 ימים — יכולת המודל לזהות מפיצים מרכזיים ונתיבי שמועה עיקריים השתפרה, ולעשות זאת עם זמן עיבוד נמוך יותר לעומת טכניקות מבוססות רשת מתחרות.

מובן הדבר במלחמה במידע מטעה

במלים פשוטות, המחקר מראה שניתן לבנות מערכת שלא רק מזהה חדשות כנראה כזב ברמת דיוק גבוהה מאוד, אלא גם עוקבת אחרי אופן התפשטותן ומי אחראי ביותר להפצתן. במקום להתייחס לכל המשתמשים ולכל הקשרים כשווים, השיטה מבליטה קבוצה מצומצמת יותר של קהילות ויחידים שהתנהגותם משמעותית ביותר לשליטה בסיפורים מזיקים. למרות שהעבודה נעשתה על נתוני טוויטר מאוננים על Covid‑19 ועשויה שלא להיות ישימה ישירות לכל פלטפורמה או נושא, היא מציעה דרך לתגובות ממוקדות יותר ומונעות נתונים לשמועות מקוונות — כגון ייעוד בדיקות עובדות, אזהרות או התערבויות פלטפורמה איפה שהן יכולות להשפיע ביותר — תוך שמירה על פרטיות אינדיבידואלית ושימוש אתי במידע.

ציטוט: Zhang, W., Qian, M. & Zhang, Q. A multi-modal approach for recognizing fake news and influential nodes in spreading them using deep learning and network analysis. Sci Rep 16, 9775 (2026). https://doi.org/10.1038/s41598-026-35342-7

מילות מפתח: חדשות כזב, רשתות חברתיות, הפצת שמועות, למידה עמוקה, משתמשים משפיעים