Clear Sky Science · he

TRGCN: מסגרת היברידית לגילוי שמועות ברשתות חברתיות

2026-03-26 · חזרה לאינדקס

מדוע שמועות מקוונות חשובות לכולם

ממפחי חיסונים ועד פאניקה פיננסית, פוסט כוזב אחד יכול להתפשט במדיה החברתית ולעצב את מה שמיליוני אנשים חושבים ועושים. בודקי עובדות אנושיים מתאמצים להדביק את הקצב, אך עוצמת ועצמת השיח המקוון מקשה על בדיקה ידנית של הכל. מחקר זה מציג גישה חישובית חדשה שמזהה אוטומטית סיפורים חשודים על ידי בחינה לא רק של מה שאנשים כותבים, אלא גם של האופן שבו המידע מתפשט ברשת משתמשים.

Figure 1. כיצד בינה מלאכותית קוראת שיחות במדיה החברתית כדי להבחין בין שמועות למידע מהימן.

כיצד שמועות זורמות ברשתות חברתיות

המחברים מתחילים בבחינה של שמועות כתהליך חברתי. בפלטפורמות כמו טוויטר, אדם מפרסם טענה, אחרים עונים, משתפים, תומכים או חולקים הסתייגות, והאינטראקציות הללו יוצרות רשת מסועפת של הודעות. יש משתמשים המשמשים כצמתים שמחזיקים את השמועה בחיים גם מרחקים רבים מהמקור. דפוס מי עונה למי ומתי נושא רמזים לגבי האם הטענה סבירה, שקרית, מאומתת או עדיין לא מאומתת. מודלים מסורתיים התמקדו או בטקסט בלבד או בצורת הרשת בלבד, וחסרו את התמונה המלאה של האינטראקציה בין תוכן וקשרים.

מגבלות של שיטות גילוי מוקדמות

גישות מוקדמות הסתמכו על תכונות מעוצבות ידנית כמו תדירות שיתוף פוסט, אורך ההודעות או סטטיסטיקות בסיסיות על משתמשים. בעוד ששיטות אלה תפסו דפוסים פשוטים, הן התקשו עם האותות המורכבים ובעלי הממד הגבוה שנמצאים ברשתות חברתיות גדולות. אחר כך, מודלים עמוקים כגון רשתות חוזרות וקונבולוציה למדו דפוסי טקסט עשירים יותר ודפוסי זמן קצרים, אך לא תפסו במלואם את המבנה המסועף של התפשטות השמועה. שיטות מבוססות גרפים שיפרו את המצב על ידי התייחסות לשיחות כרשתות של פוסטים ומשתמשים, אך מודלים גרפיים נפוצים נאבקו במעקב אחרי שרשראות השפעה ארוכות על פני מרובות צעדים.

מודל היברידי שבוחן גם צורה וגם סיפור

כדי לגשר על הפערים הללו, החוקרים מציעים מסגרת היברידית בשם TRGCN. היא משלבת שני סוגים רבי-עוצמה של רשתות עצביות: רשתות קונבולוציה גרפיות (GCN), המתאימות לניתוח רשתות, ורשתות Transformer, שהן מצטיינות במעקב אחרי קשרים לטווח ארוך בסדרות. ראשית, המודל ממיר כל פוסט לייצוג מספרי המבוסס על חשיבות כל מילה באוסף הטוויטים. במקביל, הוא מקודד את דפוס התשובות והשיתופים כגרף. שתי הראיות האלה מתמזגות כך שכל צומת ברשת ההפצה נושא הן את משמעות הטקסט והן את מיקומו בשיחה.

Figure 2. כיצד מודל רשת היברידי מייגע דפוסי התפשטות שמועות וטקסט כדי למיין אירועים לארבע רמות אמינות.

מעקב אחר מסלול השמועה שלב אחר שלב

לאחר מכן TRGCN מעשיר את ייצוגי הצמתים בכמה שלבים. מודול גרפי בוחן כל פוסט ואת שכניו כדי לתפוס דפוסי אינטראקציה מקומיים, כגון אשכולות של משתמשים החוזרים על טענה או מפקפקים בה. סכימת מיקום מסמנת כמה רחוק כל פוסט מהמקור, ועוזרת למודל להבין את עומק השיחה. הנתונים עוברים אז דרך מודול Transformer, שמנגנון הקשב שלו סורק את כל המבנה כדי לתפוס קשרים ארוכי טווח ועדינים שעשויים לקשר חלקים מרוחקים במפל השמועה. לבסוף, שכבת גרף נוספת מעדנת את האותות המשולבים, ושלב סיווג מעריך האם האירוע הוא ללא שמועה, שמועה מאומתת, שמועה שקרית, או עדיין לא מאומתת.

כמה השיטה עובדת בפועל

המחברים בודקים את TRGCN על שני מערכי נתוני טוויטר נפוצים הכוללים אלפי אירועי שמועה מתוייגים על ידי בודקי עובדות מומחים. הם משווים את המסגרת שלהם לקבוצת שיטות קיימות רחבה, ממודלים קלאסיים של למידת מכונה ועד מערכות מתקדמות מבוססות גרף. בשני מערכי הנתונים, המודל החדש משיג את הדיוק הגבוה ביותר, ומבדיל נכון בין סיפורים אמיתיים, שקריים ומעורפלים בתדירות גבוהה יותר מהחלופות. ניסויים נוספים שבהם מוסרים רכיבים מרכזיים כמו מנגנון הקשב, מידע מיקומי או קישורים שאריתיים מראים שהביצועים יורדים בכל מקרה. ממצאים אלה מצביעים על כך שעוצמת המודל נובעת משילוב מדוד של מבנה הרשת, תוכן טקסטואלי והקשר לטווח ארוך.

מה המשמעות לשיחות מקוונות בטוחות יותר

למשתמשים היומיומיים ולמנחי הפלטפורמות, המסקנה המרכזית היא שאופן התפשטות סיפור ברשת יכול להיות לחשוף לא פחות מהמילים שהוא מכיל. על ידי לימוד משותף מתוכן ההודעות ומדפוסי השיחה המסועפים סביבן, TRGCN מציע דרך מדויקת יותר לסמן טענות מטעות לבדיקה מעמיקה. אמנם הוא אינו מחליף את שיקול הדעת האנושי, אך כלים כאלה יכולים לסייע לבודקי עובדות ולפלטפורמות להגיב מהר יותר לשמועות מזיקות ולתמוך בסביבת מידע בריאה יותר.

ציטוט: Yan, Y., Zhang, S., Yu, D. et al. TRGCN: a hybrid framework for social network rumor detection. Humanit Soc Sci Commun 13, 692 (2026). https://doi.org/10.1057/s41599-026-06946-1

מילות מפתח: שמועות במדיה החברתית, זיהוי שמועות, רשתות עצביות גרפיות, מודלי Transformer, מידע מטעה