Clear Sky Science · he

השפעות מקומיות מצטברות ורשתות עצביות גרפיות לחיזוי קישורים

· חזרה לאינדקס

מדוע חשוב להבין קישורים חבויים

רבים מהמערכות שמעצבות את חיינו — רשתות חברתיות, שיתופי פעולה מדעיים, רשתות מוחיות ואפילו האינטרנט עצמו — ניתנות לתיאור כרשתות של נקודות מקושרות. שאלה מרכזית היא אילו חיבורים חדשים צפויים להיווצר בעתיד, למשל מי ישתף פעולה עם מי או איזה מאמר יצטט איזה מאמר. רשתות עצביות גרפיות מודרניות הן כלים חזקים למשימה זו של "חיזוי קישורים", אך הן גם תיבות שחורות: הן עובדות טוב, אך קשה לראות מדוע הן מקבלות החלטה מסוימת. המאמר הזה מתמודד עם הבעיה על ידי התאמת טכניקת הסבר כללית כדי שנוכל לראות כיצד שינוי בתכונה בודדת של צומת משפיע על הסיכויים להופעת קישורים אליה.

Figure 1
Figure 1.

מציונים פשוטים למוחות גרפיים אטומים

מדע הרשתות המוקדם הסתמך על כללים פשוטים כדי לנחש קישורים חסרים או עתידיים. למשל, שני אנשים עם הרבה חברים משותפים נוטים יותר להפוך לחברים, ודפי אינטרנט בעלי חיבורים רבים נוטים למשוך עוד קישורים. בעשור האחרון, ציונים בעבודת יד אלה הוחלפו בשיטות שלומדות תיאורים נומריים קומפקטיים, או הטמעות, עבור כל צומת. רשתות עצביות גרפיות עושות צעד נוסף: הן מעבירות מסרים שוב ושוב לאורך הקישורים כך שההטמעה של כל צומת אוספת מידע מהשכנים שלה ומהשכנים של השכנים. זה הופך אותן למצוינות בחיזוי קישורים אך גם גורם לכך שהמנגנון הפנימי מתערבל וקשה לפרש אותו.

לראות כיצד תכונה אחת מזיזה את התחזיות

מחוץ לעולם הגרפים, דרך פופולרית לפרש מודלים שחורים נקראת השפעות מקומיות מצטברות (Accumulated Local Effects, ALE). במקום רק לומר אילו תכונות חשובות, ALE שואלת כיצד תחזית המודל משתנה כשמזיזים תכונה אחת למעלה או למטה לאורך טווח הערכים שלה, ואז מצטברת השינויים המקומיים האלה לעקומה חלקה. המחברים מותאמים את ALE לחיזוי קישורים עם רשתות עצביות גרפיות על ידי שינוי בתכונה של צומת אחת בכל פעם ובדיקה כיצד הסתברות החיזוי של קישורים בין אותה צומת ולבין רבות אחרות מגיבה. זה מייצר ויזואליזציה שמראה, למשל, כיצד העלאת החלק של מחברי "הטק הגדולה" במאמר או שינוי במיקום האנכי של מקטע כלי דם במוח משנה את הסיכוי המוערך של המודל להופעת חיבור.

שתי דרכים לחשב השפעות: מדויק ומהיר

רשתות עצביות גרפיות מגישות פן מיוחד ל-ALE: כשמשנים הרבה צמתים בבת אחת, הם יכולים להשפיע זה על זה דרך העברת המסרים, פוטנציאלית לעוות את ההסבר. לכן המחברים משווים בין שתי אסטרטגיות. בגרסה ה"מדויקת", התכונה של כל צומת משתנה בבידוד, כך שאף שני צמתים ששונו לא יכולים לזהם את ההטמעות זה של זה — אך זה יקר מבחינה חישובית. בגרסה ה"משוערת", משנים הרבה צמתים בו‑זמנית, מטפלים בנתונים יותר כמו טבלה רגילה ומתעלמים מהאינטראקציות הללו; זו הרבה יותר מהירה אך עלולה להכניס הטיה. על‑ידי שינוי שיטתי של כמה צמתים משתנים בכל פעם וכמה שותפים פוטנציאליים הם נבדקים כנגדם, המחברים מודדים כיצד בחירות אלה משפיעות על עקומות ה‑ALE.

Figure 2
Figure 2.

בדיקה על גרפים סינתטיים ונתונים אמיתיים

כדי לבדוק דיוק, הצוות בונה תחילה רשת סינתטית שבה החוק האמיתי הקובע את יצירת הקישורים ידוע: הקשתות סבירות יותר כאשר תכונת "אות" מיוחדת גבוהה בשני הקצוות. כאן הם יכולים להשוות את עקומות ה‑ALE ישירות לאמת הבסיס. הם מגלים שככל שמשנים יותר צמתים בבת אחת, השיטה המשוערת סוטה יותר מהיחס האמיתי, בעוד השיטה המדויקת נשארת נאמנה. בערכות נתונים גדולות מעולם אמיתי — רשת ציטוטים של מאמרי בינה מלאכותית ומפה תלת‑ממדית מפורטת של כלי דם במוח העכבר — כבר לא רואים את חוק האמת, ולכן הם משתמשים בשיטה המדויקת, מאוגדת על פני ריצות רבות, כהסבר סטנדרטי ובודקים כמה השיטה המשוערת סוטה. מבחנים סטטיסטיים וניסויי permutation מראים שבמרבית צמדי המודל‑ערכה הנתונים, ההבדלים בין שתי השיטות מתונים, אם כי העקומות המשוערות משתנות יותר מריצה לריצה.

מה ההשפעות האלה חושפות על העולם

מעבר לשיטות, עקומות ה‑ALE מציעות הצצות למה שהמודלים באמת למדו. ברשת הציטוטים, הן מצביעות על כך שמאמרים עם אחוז גבוה יותר של מחברים המשתייכים לחברות טכנולוגיה גדולות נוטים יותר — לפי המודל — לקבל ציטוטים, מה שמחזיר תהיות על ההשפעה הגוברת של התעשייה במחקר ה‑AI. בגרף כלי הדם, שתי ארכיטקטורות שונות של רשתות עצביות גרפיות למדו נטיות הפוכות לגבי הקשר בין גובה כלי דם במוח לקישוריות שלו, מה שמדגיש ש‑ALE חושפת את האמונות של המודל, לא בהכרח אמת ביולוגית. חוסר התאמות כאלה יכול להצביע על מקומות שבהם ארכיטקטורת המודל, נתוני האימון או ההערכה זקוקים למחשבה מחודשת.

מסקנה לקוראים ולמתרגלים

המחקר מראה שניתן לעצב מחדש את השפעות מקומיות מצטברות כדי להסביר חיזויי קישורים ברשתות עצביות גרפיות, ומספק עקומות אינטואיטיביות שמראות כיצד שינוי בתכונה של צומת דוחף את הסתברויות הקישור למעלה או למטה. חישוב עקומות אלה בצורה מדויקת אמין יותר אך איטי יותר, בעוד שקירוב מהיר יותר מספיק לעתים קרובות אם סובלים מעט רעש נוסף, במיוחד כשמממדים על פני ריצות רבות. עבור מי שכבר משתמש בכלי הסבר על מודלים סטנדרטיים של למידת מכונה, זה מביא דרך ויזואלית מוּכרת להציץ לתוך מערכות מורכבות מבוססות גרפים ולבחון האם מה שהמודל למד אכן תואם את הבנתנו את הרשתות שאכפת לנו מהן.

ציטוט: Kaczyńska, P., Sienkiewicz, J. & Ślęzak, D. Accumulated local effects and graph neural networks for link prediction. Sci Rep 16, 8574 (2026). https://doi.org/10.1038/s41598-026-39000-w

מילות מפתח: רשתות עצביות גרפיות, חיזוי קישורים, הסברת מודלים, השפעות מקומיות מצטברות, מדע הרשתות