Clear Sky Science · he
קשב גרפי וסמנטיקה טקסטואלית משפרים המלצות מותאמות אישית
מדוע הצעות חכמות יותר חשובות
כל פעם שאתם פותחים חנות מקוונת, אפליקציית סרטים או חנות ספרים באינטרנט, אתם מסתמכים על אלגוריתמים המנפים שפע אפשרויות כדי להציג מספר מועט שעשוי לעניין אתכם. עם זאת, מערכות המלצה רבות מתקשות כאשר קיים מעט מידע על משתמש או פריט, או כאשר הטעם של אנשים משתנה עם הזמן. המחקר הזה מציג גישה חדשה להמלצות שלא מסתכלת רק על מי לחץ על מה, אלא גם קוראת את הטקסט שמקיף את הפריטים — כמו ביקורות ותיאורים — ובוחנת רשת של מושגים קשורים כדי לנחש טוב יותר מה תאהבו בהמשך.

ממתאמים פשוטים לחיבורים עשירים
כלי המלצה מסורתיים עובדים קצת כמו מציאת אנשים עם היסטוריית קניות או צפייה דומה והעתקת הבחירות שלהם. גישה זו, המכונה סינון שיתופי, נשענת על טבלאות גדולות של אינטראקציות משתמש–פריט. כאשר טבלאות אלה דלות — כי משתמשים חדשים, פריטים לא מוכרים או משוב מועט — המערכת מהר מאבדת רמזים. ניסיונות קודמים לתקן את הבעיה הוסיפו תכונות טקסט: למשל כריית ביקורות משתמשים כדי ללכוד דעות לגבי עלילות, סגנונות כתיבה או שחקנים. שיטות אלה סייעו, אך לעתים הן התייחסו לכל הביקורות כאילו כולן חשובות באותה מידה וכשלו במודל של הדינמיקה העדינה בין הטעמים של המשתמש ותכונות הפריט.
בונה רשת ידע
המחברים נוקטים בגישה שונה על ידי הצבת משתמשים ופריטים בתוך גרף ידע — רשת שבה צמתים יכולים לייצג ספרים, סרטים, מחברים, ז’אנרים וישויות נוספות, והקשתות מקודדות את הקשרים ביניהן. בהגדרה זו, מסלולים עקיפים יכולים לחשוף העדפות חבויות; לדוגמה, משתמש שאוהב מספר סרטים המקושרים לאותו במאי או נושא עשוי גם ליהנות מעבודות קרובות אף אם לא דירג אותן מעולם. עם זאת, חיפוש נאיבי של צעדים רבים בגרף כזה עלול להכניס רעש ולהיות יקר חישובית. האתגר הוא לתת למודל להקשיב לשכנים המידעיים ביותר ברשת הזו תוך התעלמות מקשרים מטעהים או מרוחקים.
להניח למודל לשים לב
המודל המוצע, הנקרא TNRA, מתמודד עם זה באמצעות רשתות קשב גרפיות בצד המשתמש וקונבולוציה גרפית בצד הפריט. עבור משתמשים, המודל מתווה "גלים" רב-שלביים דרך גרף הידע החל מהפריטים שהם התקיימו איתם, ומקצה משקולות גבוהות יותר לקשרים הרלוונטיים יותר. מנגנון הקשב הזה אומר שלא כל הצמתים השכנים משפיעים באופן שווה על פרופיל המשתמש; המערכת לומדת אילו מסלולים חשובים לחיזוי עניין חדש. בצד הפריט, המודל מדגם קבוצת צמתים קרובה מוגבלת — כמו מוצרים קשורים או תכונות — וממזג את התכונות שלהן כדי ליצור דיוקן מעודן של כל פריט, שוב מונחה על ידי מידת ההתאמה של השכנים לטעם המשתמש הנתון.
להדריך את המערכת לקרוא
מהלך מפתח הוא ש-TNRA אינו מסתמך רק על מבנה הגרף. הוא גם לומד מהשפה בביקורות משתמשים ותיאורי פריטים. לאחר ניקוי וטוקניזציה של הטקסט, המערכת הופכת משפטים לווקטורים קומפקטיים הלוכדים משמעות — כמו התלהבות מז’אנר מסוים או תלונות על קצב הסיפור. וקטורים הנגזרים מטקסט אלה מאוחדים עם הייצוגים המבוססים גרפית של משתמשים ופריטים, ומעשירים כל צומת גם בקשרים מבניים וגם בניואנסים סמנטיים. כאשר המערכת בהמשך משווה בין משתמש לפריט, היא בעצם משווה את ה"סיפורים" המשולבים שלהם ולא רק היסטוריית לחיצות גולמית.
מבחן השיטה
החוקרים העריכו את TNRA על שני ערכות מבחן ידועות: אוסף דירוגים רחב היקף של ספרים ומאגר הסרטים MovieLens-1M, שניהם משודרגים באמצעות גרף ידע מסחרי. הם השוו את הגישה שלהם למספר בסיסים חזקים המשתמשים בלמידה עמוקה ושיטות גרפיות. על פני מטריקות מרובות — כולל עד כמה המודל מבחין בין פריטים שמשתמש התفاعل עימם לבין אלו שהתעלם מהם, וכמה פריטים רלוונטיים מופיעים בחלק העליון של רשימת ההמלצות — TNRA יצא בעקביות לפני האחרים. הוא השיג ציונים גבוהים במידה קטנה אך משמעותית, בעיקר בהגדרות שבהן הנתונים דלים, וביצע זאת עם זמני אימון ושימוש בזיכרון השווים למערכות גרפיות אחרות.

מה זה אומר למשתמשים היומיומיים
במילים פשוטות, עבודה זו מראה שמערכות המלצה יכולות להיות מדויקות ועמידות יותר על ידי שילוב שתי רעיונות: ייצוג העולם המקוון כמרשת ישויות מקושרות, ואפשרות שהמודל "יקרא בין השורות" של ביקורות ותיאורים. על ידי מיקוד קשוב בקשרים הרלוונטיים ביותר ושילוב משמעות טקסטואלית, TNRA יכול לנחש טוב יותר מה אנשים צפויים לאהוב, אפילו כאשר קיימים מעט אותות מפורשים. עבור משתמשים, הדבר עשוי להתבטא בהצעות ספרים וסרטים מתאימות יותר ופחות רשימות לא רלוונטיות, במיוחד עבור טעמים נישתיים ופריטים חדשים שמנגנונים מסורתיים נוטים להתעלם מהם.
ציטוט: Dong, J., Shen, Z., Luo, H. et al. Graph attention and text semantics improve personalized recommendation. Sci Rep 16, 11672 (2026). https://doi.org/10.1038/s41598-026-46737-x
מילות מפתח: המלצות מותאמות אישית, גרף ידע, רשת עצבית גרפית, סמנטיקה טקסטואלית, מערכות המלצה