Clear Sky Science · he

KGERA: ארכיטקטורת הסקה משופרת באמצעות אשכול ידע למערכות המלצה

· חזרה לאינדקס

למה המלצות חכמות חשובות

אתרי סטרימינג ואפליקציות קניות נבצעו ללא הרף מה תהיה ההעדפה הבאה שלך. למרות שזמינים הררי נתונים, ההמלצות לעתים נראות לא מדויקות: כלליות מדי, מתמקדות בלהיטים או עיוורות לתמהיל המיוחד של הדברים שאתה באמת נהנה מהם. מאמר זה מציג את KGERA, גישה חדשה להמלצות שמנסה לחשוב יותר כמו חבר תמציתי מאשר כמו מנוע סטטיסטי, על ידי שילוב ראיות מסוגים שונים על פריטים יחד עם תהליך הסקה מפורש וקל משקל מעל רשת ידע על סרטים.

Figure 1
Figure 1.

מתבניות פשוטות לחיבורים עשירים יותר

מרבית מערכות ההמלצה הקיימות נשענות במידה רבה על סינון שיתופי: אם אנשים שאהבו את אותם סרטים כמוך גם אהבו כותר מסוים אחר, הכותר הזה יומלץ לך. זה עובד טוב כאשר יש שפע נתונים, אך מתקשה עם פריטים חדשים או נישתיים ועם משתמשים שיש להם רק כמה אינטראקציות. שיטות אחרות מוסיפות מידע תוכני כגון ז'אנרים או תיאורי טקסט, או משתמשות ברשתות עצביות גרפיות המטפלות במשתמשים ובפריטים כנקודות ברשת אינטראקציות רחבה. עם זאת, מערכות אלו לעתים קרובות ממצמצות הכול לייצוגים מספריים צפופים, מה שמקשה להבין מדוע הופיעה הצעה ומאט את ההתאמה כאשר הקטלוג או הטעם שלך משתנים.

בניית מפת ידע על סרטים

KGERA מתחילה בבניית אשכול ידע: מפת מבנית שמקשרת בין משתמשים, סרטים, ז'אנרים וישויות דמויות-יוצר. באשכול זה, יחסים מתארים מי צפה במה, לאילו ז'אנרים שייך סרט, לאיזה 'פאודו-במאי' הוא קשור, ואילו סרטים דומים, משלימים או ניתנים להחלפה. סרטים דומים נוטים לשתף גם ז'אנר וגם יוצר; סרטים משלימים מגיעים מז'אנרים שונים אך קרובים בתמה; סרטים ניתנים להחלפה חיים באותו ז'אנר והם די דומים, כך שיכולים לשמש כאלטרנטיבות מבלי להיות שכפולים מדויקים. אשכול זה תופס לא רק הופעה משותפת, אלא את הדרכים הרבות שבהן סרטים יכולים להיות קשורים.

שכבת הסקה שפועלת בזמן ההחלטה

מעל מפת זו, המחברים מעצבים מודול הסקה שמפעיל בעת הצורך בקבלת המלצות, ולא רק בזמן ריצות אימון ארוכות. עבור משתמש נתון, הוא בונה תחילה פרופיל המסכם את הסרטים שכבר אהב. לאחר מכן הוא מדרג כל מועמד דרך כמה עדשות שקופות: דמיון כללי לפרופיל המשתמש, חפיפה בז'אנרים מועדפים, התאמה להעדפות יוצרים, אפשרויות "מרחיבות" חוצות-ז'אנר אך קרובות מבחינת נושא, תחליפים בתוך ז'אנר שמאזנים בין מוכרות לחדשנות, ועונש לפריטים שהם כמעט העתקים מדויקים של מה שהמשתמש כבר ראה. רכיבים אלו משולבים לציון יחיד באמצעות משקלים מתמטיים פשוטים, מה שהופך את הלוגיקה להבנה קלה ולכיוון פשוט כאשר ההתנהגות או תוכן הקטלוג משתנים.

Figure 2
Figure 2.

מיזוג כמה קולות לבחירה סופית אחת

במקום להסתמך על מודל יחיד, KGERA מקשיבה לתשעה אסטרטגיות המלצה שונות ואז מאפשרת למטא-מודל קטן להחליט כמה בסמוך לסמוך לכל אחת מהן. לצד מודול ההסקה, היא כוללת שיטות שכונה קלאסיות, ממליצים מבוססי גרפים, מודלים גרפיים ללמידה עצמית, מסנן שיתופי נוירלי, אות פופולריות, מודל הטמעת אשכולות ידע ומודל טקסט מבוסס תוכן. כל הניקוד שלהם מנורמל ומוזן לרגרסיה לוגיסטית פשוטה שלומדת משקל לכל מרכיב. מעניין ששכנות פריט-אל-פריט ותוכן טקסט עולים כתרומות החיוביות החזקים ביותר, בעוד פופולריות וכמה אותות גרפיים מקבלים משקלים שליליים ומשמשים כמנטרלים מכוונים, לדחוף חזרה נגד הנטייה לקדם יתר על המידה להיטים על חשבון כותרים פחות מוכרים אך רלוונטיים.

שיפורים יציבים על פני משתמשים, פריטים וז'אנרים

המחברים בוחנים את KGERA על מערך הנתונים המוכר MovieLens-1M ומשווים אותה עם בסיסים מודרניים חזקים, כולל שיטות גרפיות ללמידה עצמית עדכניות. על פני מדדי מיקום מרובים ואורכי רשימות שונים, KGERA יוצאת עקבית כמובילה, לעתים בשיפור יחסי של למעלה מ-50 אחוזים בכמה מדדי מיקום שממקמים את הסרט הרלוונטי באמת קרוב לראש הרשימה. השיפורים גדולים במיוחד עבור משתמשים עם מעט אינטראקציות עבר ועבור סרטים בביניים בפופולריות—שני תחומים שמערכות עכשוויות מתקשות בהם לעתים קרובות. מחקרי האבלציה המפורטים, חלוקת צולב ובדיקות רגישות מראים שהשיפורים יציבים ולא תלויים בבחירת היפרפרמטר מסוימת או בחלוקת נתונים, אם כי ז'אנרים מסוימים כגון דרמה נשארים מאתגרים.

מה זה אומר להמלצות יום-יומיות

ללא מומחים, המסר המרכזי הוא שניתן להפוך המלצות לחכמות ומובנות יותר על ידי הסקה מעל מפת יחסים ברורה בין פריטים, במקום להחביא הכול בתוך מודל תיבה-שחורה גדול. KGERA מראה ששכבת הסקה מהירה בזמן בדיקה, בשילוב תמהיל מכויל בקפידה של שיטות ישנות וחדשות, יכולה לספק המלצות טובות יותר שניתן להבחין בהן בלי להישען על מודלים שפתיים איטיים ויקרים. במציאות, זה עשוי להתבטא בממשקי סטרימינג וקניות שיציגו אפשרויות רלוונטיות, מגוונות ומקריות יותר, במיוחד למשתמשים חדשים ולפריטים פחות מפורסמים, ועדיין מספיק יעיל כדי לפעול בזמן אמת.

ציטוט: Muniraja, P., Satapathy, S.M. KGERA: knowledge graph enhanced reasoning architecture for recommendation systems. Sci Rep 16, 13994 (2026). https://doi.org/10.1038/s41598-026-42865-6

מילות מפתח: מערכות המלצה, אשכולות ידע, הסקת גרפים, למידת אנסמבל, המלצות סרטים