Clear Sky Science · he

מסגרת המלצות היברידית המשתמשת בהטבעות RoBERTa מותאמות לדומיין לשיפור ההתאמה האישית במסחר אלקטרוני

2026-03-22 · חזרה לאינדקס

הצעות קנייה חכמות יותר

כל מי שקונה אונליין נתקל בהצעות מוצרים שמרגישות מוזרingly מתאימות — או, באותה מידה, לגמרי חסרות קשר. מאמר זה בוחן דרך חדשה לבניית מערכות המלצה כך שיבינו טוב יותר גם במה המוצרים באמת עוסקים וגם מה אנשים אוהבים באמת, אפילו כשהנתונים הראשוניים דלים. המטרה היא להפוך את רשימות ה"ייתכן שתאהב גם" ליותר מדויקות, מגוונות ומהימנות לקונים היומיומיים.

למה הבחירות המקוונות לעתים מפספסות

מערכות המלצה מסורתיות מסתמכות על שני עקרונות מרכזיים. האחד משווה אותך לאנשים שהתנהגו כמוך בעבר ומציע פריטים שהם אהבו. השני בוחן תכונות של המוצר — כגון קטגוריה, מותג או מילות מפתח פשוטות — ומותאם להעדפות הידועות שלך. שיטות אלה נחלשות כשהנתונים דלים, כשהופיעים משתמשים או מוצרים חדשים (בעיית "התחלה קרה"), או כשהטעמים שלך משתנים לאורך הזמן. מערכות היברידיות מתקדמות מנסות לשלב מספר אותות, אך לעתים קרובות הופכות למורכבות, איטיות וקשות לפרשנות, במיוחד כשמדובר במיליוני משתמשים ומוצרים.

שילוב הבנת שפה בהמלצות

המחברים מציעים מסגרת בשם HyReC המסתמכת במידה רבה על האופן שבו אנשים מדברים על מוצרים. היא משתמשת במודל שפה חזק, RoBERTa, שאומן נוסף על טקסט של תחום המסחר האלקטרוני כדי להיות "שוטפת" בביקורות ותיאורי מוצרים מתחום מוצרי התינוק. מודל זה ממיר טקסט גולמי — כותרות, תיאורים והביקורות הבולטות — לטביעות אצבע מספריות צפופות השבות משמעות וסנטימנט, כגון האם אנשים משבחים עמידות, מתלוננים על נזילות או מציינים קלות שימוש. טביעות תוכן אלה מסייעות ל-HyReC לזהות ששני מוצרים דומים גם אם יש להם שמות מותג שונים או ניסוח שונה במעט.

ערבוב התנהגות, הרגלים ודעות

טקסט לבדו אינו מספיק, לכן HyReC גם לומדת מהתנהגות ממשית של משתמשים. רשת ניורונים עמוקה מנתחת דפוסים של מי דירג אילו פריטים, ומגלה קשרים נסתרים — למשל, שאנשים שאוהבים עגלות מסוימות נוטים גם לאהוב מושבי רכב פרטיים. בנוסף, המערכת מחשבת סטטיסטיקות פשוטות ואינטרפרטביליות כגון דירוג ממוצע לכל משתמש, עד כמה הוא קפדן או נדיב, תדירות האינטראקציה שלו וכמה השיפוטים שלו מוטים לעבר ציונים גבוהים או נמוכים במיוחד. סטטיסטיקות דומות מחושבות גם עבור מוצרים. סיכומים התנהגותיים אלה מסייעים למערכת להסיק על משתמשים עם מעט דירוגים או על מוצרים שזה זה עתה הופיעו, ובכך להקל על בעיות התחלה קרה.

לאפשר למודל להחליט מה חשוב ביותר

החידוש המרכזי ב-HyReC הוא האופן שבו הוא ממזג את האותות השונים האלה. במקום פשוט לערום את כל המספרים יחד, הוא משתמש במנגנון "קשב" שלומד לשקלל תוכן, דפוסי שיתופיות וסטטיסטיקות התנהגותיות בצורה שונה עבור כל זוג משתמש–מוצר. עבור קונה אחד, הטקסט בביקורות עשוי לשאת את המשקל הרב ביותר; עבור אחר, דפוסי דירוג עבר עשויים לשלוט. המודל מזין את הייצוג המעורב הזה לשכבת מיון שנועדה במיוחד למיין פריטים מועמדים כך שהרלוונטיים ביותר יעלו לראש. האימון נעשה עם טכניקות אופטימיזציה המותאמות למשימות דירוג, מה שעוזר למערכת להצליח ברשימות המלצה "Top-K" במציאות ולא רק בחיזוי ציונים גולמיים.

הוכחת הגישה על נתוני קנייה אמתיים

לצורך בדיקת HyReC, המחברים משתמשים במאגר נתוני מוצרי Amazon Baby הכולל מעל 56,000 ביקורות על פני אלפי משתמשים ומוצרים. הם משווים את המודל שלהם מול מספר קווים בסיס מודרניים, כולל גישות למידה עמוקה ובניית גרפים. HyReC מפיקה שגיאות חיזוי נמוכות באופן דרמטי והתאמה כמעט מושלמת עם דירוגי המשתמשים בפועל, והיא משיגה זיכרון ושלמות F1 גבוהים מאוד כשהיא מוערכת כמשימת דירוג. ניסויים נוספים מראים שהסרת כל רכיב — הטבעות טקסט, אותות שיתופיות, סטטיסטיקות התנהגותיות, מנגנון הקשב או שכבת הדירוג — פוגעת באופן ניכר בביצועים, דבר שמדגיש שלכל חלק תפקיד מובחן וחשוב.

מה משמעות הדבר למשתמשים היומיומיים

בעגה פשוטה, עבודה זו מראה שמערכות המלצה יכולות להפוך לחכמות ושקופות יותר על ידי שילוב מה שאנשים אומרים, מה שהם עושים וכיצד הם נוטים להתנהג לאורך זמן, במקום להסתמך על מקור מידע יחיד. עבור קונים, זה יכול להוביל להצעות רלוונטיות יותר, גילוי טוב יותר של מוצרים חדשים או נישתיים ופחות חוויות מתסכלות בעת גלישה. עבור חברות, זה מציע דרך סקלאבילית לטפל בנתונים דלים וטעמים משתנים מבלי להפוך את המערכות לקופסאות שחורות. המחברים מציעים שתחומים עתידיים יכולים לכלול אותות עשירים יותר — כמו תמונות או לולאות משוב ארוכות טווח — כדי לקדם את ההתאמה האישית המקוונת קרוב יותר לאופן שבו מוכר אנושי מתחשב היה מדריך את בחירותיך.

ציטוט: Rajpoot, C.S., Tiwari, V. & Vishwakarma, S.K. A hybrid recommendation framework utilizing domain-adaptive RoBERTa embeddings for enhanced personalization in e-commerce. Sci Rep 16, 14541 (2026). https://doi.org/10.1038/s41598-026-38853-5

מילות מפתח: מערכות המלצה, התאמה אישית במסחר אלקטרוני, המלצה היברידית, למידה עמוקה, התנהגות משתמש