Clear Sky Science · he

HyMSS-GAD: מסגרת היברידית מרובת שלבים לזיהוי אנומליות בגרפים רב־מבטיים באמצעות היגיון מבני, הקשרי וגאומטרי

· חזרה לאינדקס

מדוע חשוב לגלות דפוסים חריגים ברשתות

מרשתות חברתיות וחנויות מקוונות ועד מערכות פיננסיות וביולוגיה — חלק ניכר מהנתונים של היום מתארים רשתות: נקודות (צמתים) המחוברות בקווים (קישורים). בתוכם חבויים דפוסים נדירים וחריגים שעשויים להעיד על הונאה, התקפות סייבר, רשומות מדעיות שגויות או אפילו על תגליות מדעיות בלתי צפויות. המאמר מציע את HyMSS-GAD, שיטה חדשה שמחפשת אנומליות כאלה על ידי שילוב של שלוש דרכי ‘‘התבוננות’’ שונות ברשת בו־זמנית: איך כל צומת מתואר מבחינת תוכנו, איך הוא מחובר לאחרים, ואיך הוא מתאים לצורת הרשת הכללית. השילוב הזה שואף ללכוד סימני אזהרה מתוחכמים שכלים ישנים מפספסים ולספק הסבר מדוע צומת נתון חשוד.

Figure 1
Figure 1.

לראות יותר מפן אחד של רשת

שיטות מסורתיות למציאת צמתים חריגים בגרפים לרוב מניחות כי צמתים מחוברים הם דומים זה לזה. כלל זה של "עופות מאותו נוצות עפים יחד" עובד בחלק מרשתות חברתיות או רשתות ציטוטים, אבל מתמוטט כאשר הקישורים מקשרים בין סוגי ישויות מאוד שונים — מצב שמאפיין מערכות אמיתיות רבות. מודלים ישנים נוטים גם להתמקד או בדפוס הקישורים או בתכונות הצמתים, ולא בשניהם בו־זמנית, ולעתים לקרוס כל המידע לתצוגה אחת. HyMSS-GAD מתחיל מהרעיון שאנומליות מופיעות כהתנגשויות בין כמה מבטים של אותו צומת: התכונות התיאוריות שלו, המיקום שלו בתבניות חיבור מקומיות קטנות, והתפקיד שלו בצורת הרשת הכוללת.

ללמוד מתי תוכן ושכונה אינם מסכימים

השלב הראשון של HyMSS-GAD מחפש חריגויות "הקשריות": צמתים שהתוכן שלהם אינו תואם למה שהשכנים שלהם מרמזים. עבור כל צומת השיטה בונה רשת מקומית קטנה סביבה, ואז לומדת שני תיאורים מקבילים: אחד מבוסס על התכונות שלו (כמו מילים במאמר או פרטי מוצר) ואחד מבוסס על אופן החיבורים שלו. סכימת למידה ללא השגחה מעודדת שהשניים יסכימו עבור צמתים נורמליים ויחלוקו עבור צמתים מוזרים, ללא צורך בדוגמאות מתויגות. אי־התאמות גדולות בין הצומת לשכונה שלו הופכות לשארית מספרית שמצביעה על אנומליה הקשרית.

לקרוא את התבניות הקטנות בחיבורים

המבט השני מתמקד במבנה המפורט של הגרף. במקום לספור רק כמה שכנים יש לצומת, HyMSS-GAD מודד כמה פעמים הוא מופיע במוטיבים חיבוריים קטנים כגון משולשים, כוכבים או לולאות קצרות. ספירות אלה יוצרות "פרופיל מוטיבים" לכל צומת. רשת עצבית קומפקטית לומדת כיצד פרופילים טיפוסיים נראים ומנסה לשחזרם; צמתים שפרופיל המוטיבים שלהם קשה לשחזור יקבלו שאריות מבניות גבוהות. זה לוכד מקרים שבהם לצומת תפקיד מבני מוזר — לדוגמה, ישב במספר מועט מדי של משולשים באזור מרוכז, או יצר דפוסי חיבור נדירים שאינם תואמים את סביבתו.

Figure 2
Figure 2.

לעקוב אחר העיקולים של הרשת

מעבר לשכונות המקומיות, השיטה בוחנת את ה"צורה" הרחבה יותר של הרשת באמצעות מושג שנקרא עקומיות (curvature). בפשטות, העקומיות מודדת האם שני צמתים מקושרים חיים בסביבות דומות או שונות מאוד. קצוות בתוך קהילות צפופות נוטים להראות עקומיות גבוהה יותר, בעוד קצוות שמגשרים בין אזורים נפרדים או שוכנים בגבולות מציגים עקומיות נמוכה או אפילו שלילית. HyMSS-GAD לומדת לשחזר ערכי עקומיות מחושבים מראש מתוך התיאורים המשולבים של הצמתים. כשזה נכשל בשחזור עבור הקצוות שמקיפים צומת, הצומת מקבל שארית גאומטרית גבוהה, המסמנת אותו כאפשרי גשר, צוואר בקבוק או צומת גבול שאינו מתאים לתבנית הגלובלית הרגילה.

לאסוף את הרמזים יחד

כדי שלא לייחס לכל סוג אות אותו משקל בכל מקום, HyMSS-GAD משתמש במנגנון תשומת לב שמאפשר לכל צומת "להחליט" כמה משקל להקצות למידע הקשרי לעומת המידע המבני לפני שלב העקומיות. לבסוף, השיטה משלבת שלוש השאריות — הקשרית, המבנית והגאומטרית — לציון אנומליה יחיד. מה שחיוני הוא שהיא גם שומרת על הרכיבים נפרדים, כך שאנליסט יכול לראות האם צומת מסומן בעיקר בגלל תוכן שאינו תואם, חיבורים יוצאי דופן או מיקום גאומטרי מוזר. ניסויים על כמה מערכי נתונים סטנדרטיים, כולל גרפי ציטוטים ומסחר אלקטרוני, מראים שהגישה הרב־מבטית הזו המבוססת על שאריות לא רק עולה על חלופות מובילות, אלא גם מספקת הסברים ברורים יותר מדוע צמתים מסוימים בולטים.

ציטוט: Khan, W., Ebrahim, N., Elloumi, M. et al. HyMSS-GAD: a hybrid multi-stage framework for multi-view graph anomaly detection with structural, contextual, and geometric reasoning. Sci Rep 16, 12108 (2026). https://doi.org/10.1038/s41598-026-42823-2

מילות מפתח: זיהוי אנומליות בגרפים, ניתוח רשתות, למידת מכונה, רשתות עצביות לגרפים, נתונים מולטימודליים