Clear Sky Science · he

ניתוח סנטימנט של ביקורות מלון חוצות-שפות באמצעות למידה פדרטיבית מרובת סוכנים ורשתות קשב גרפיות הטרוגניות

· חזרה לאינדקס

מדוע ביקורות מלונות מקוונות חשובות

הבחירה במלון מתחילה יותר ויותר בגלילה ושליפת תגובות של נוסעים אחרים. הביקורות האלה מופיעות בשפות רבות ובאתרים שונים, והן יכולות לבנות או לשבור את המוניטין וההכנסות של מלון. מאמר זה מתאר מערכת חדשה שקוראת ביקורות מלון בכמה שפות במקביל, קובעת האם הן חיוביות או שליליות, ומתריעה למנהלי המלון מוקדם כשהמוניטין עומד להשתנות — וכל זאת תוך שמירה על כך שנתוני האורחים יישארו מאוחסנים בבטחה במקום שבו נכתבו.

Figure 1
Figure 1.

רבות שפות, פלטפורמות רבות, בעיה אחת

כיום נוסעים מפרסמים ביקורות באנגלית, בסינית, בצרפתית, בגרמנית ובסגנונות מעורבים באתרי הזמנות כמו Booking.com, TripAdvisor, Agoda ו‑Ctrip. כלים קיימים לעיתים מתרגמים את הכול לשפה אחת ואז מנתחים את הטקסט, מה שעלול לעוות משמעות, במיוחד בשפות קטנות או ייחודיות תרבותית. כלים אחרים שולחים את כל הטקסט של הביקורות לשרת מרכזי יחיד, דבר שמעורר חששות פרטיות ומתנגש עם חוקים מחמירים להגנת מידע. התוצאה היא שמלונות עלולים לפספס שינויים דקיקים בשביעות רצון האורחים או לא לשים לב בזמן להתקפות מתואמות של ביקורות מזויפות.

לעבוד יחד בלי לשתף נתונים גולמיים

המחברים מציעים תצורת "פדרטיבית" שבה כל זוג אתר־שפה משתתף מריץ סוכן תוכנה מקומי משלו. סוכנים אלה לומדים מהביקורות שלהם, אך במקום לשלוח את הטקסט הגולמי אל מרכז אחד, הם משתפים רק עדכונים מתמטיים לדגם משותף. שכבת תיאום משלבת את העדכונים האלה ושולחת חזרה דגם משופר לכל השותפים. אמצעי בטיחות נוספים, כמו הוספת רעש מחושב והצפנת העדכונים, מקשים מאוד על שיחזור מה שאורח מסוים כתב בפועל. תכנון זה מאפשר למערכת ללמוד מ‑154,680 ביקורות בארבע שפות תוך שמירה על עמידה ברגולציות פרטיות מודרניות.

לראות את הביקורות כרשת חיה

במקום להתייחס לכל ביקורת כחסם טקסט מבודד, המערכת הופכת את מכלול הביקורות לרשת עשירה. ברשת זו, צמתים מייצגים אורחים, מלונות, ביקורות, שפות ונקודות זמן, וקישורים לוכדים מי שהגיע לאן, מתי נכתבה הביקורת ובאיזו שפה. סוג מיוחד של רשת נוירונית "מביט" ברחבי הרשת הזו, ומשקיע יותר תשומת לב בקשרים המידעיים ביותר, כגון מבקרים מהימנים או דפוסים חוזרים בשפה מסוימת. גישה זו מאפשרת לדגם לקלוט גם אותות אוניברסליים ("מיקום מצוין", "חדר לא נקי") וגם ביטויים או הרגלים ספציפיים לשפה שלרוב חסרים במודלים רב־לשוניים רגילים.

Figure 2
Figure 2.

מציוני סנטימנט למערכת מעקב מוניטין והתראות על ביקורות מזויפות

על גבי מנוע רב־לשוני זה בנו המחברים מנגנון מעקב מוניטין העוקב אחרי שינויים במעמדו של מלון לאורך זמן. המערכת מחפשת עליות חדות בהערות שליליות, שיפורים איטיים אך יציבים לאחר שדרוגי שירות, ופרצי פעילות לא שגרתיים שעשויים להצביע על מניפולציה מאורגנת. היא מנתחת סגנון כתיבה, תזמון והתנהגות מבקרים כדי לסנן ביקורות מזויפות או חשודות, ומעדכנת את ציון המוניטין של המלון כמעט בזמן אמת. במבחנים, המערכת זיהתה ביקורות מזויפות בדיוק של מעל 93% ויכולתה לסמן שינויים משמעותיים במוניטין, בממוצע, קצת יותר משלושה ימים לפני שהשתנו בבירור בדפי דירוג ציבוריים.

מה זה אומר לנוסעים ולמלונות

לקורא כללי, המסר המעשי הוא שניתן כעת לשלב ביקורות ממספר שפות ופלטפורמות לתמונה אחת של איכות המלון שמכבדת פרטיות. המערכת המוצעת מסווגת סנטימנט של ביקורות בדיוק גבוה יותר מאשר מודלים שפתיים מובילים, מטפלת בנתונים בזהירות רבה יותר משירותים מרוכזים, ומזהה בעיות אמיתיות ודפוסי ביקורות חשודים מוקדם יותר מכלים מסורתיים. בפועל, משמעות הדבר היא שנוסעים יכולים להסתמך על דירוגים וסיכומים אמינים יותר, בעוד שמלונות מקבלים לוח בקרה לאזהרה מוקדמת שמעודד אותם לתקן בעיות במהירות ולהגיב לאורחים ביעילות — וכל זאת בלי לחשוף נתוני ביקורת אישיים מעבר למקום שבו פורסמו במקור.

ציטוט: Han, X. Cross-language hotel review sentiment analysis via multi-agent federated learning with heterogeneous graph attention networks. Sci Rep 16, 12681 (2026). https://doi.org/10.1038/s41598-026-41500-8

מילות מפתח: ביקורות מלונות, ניתוח סנטימנט, למידה פדרטיבית, זיהוי ביקורות מזויפות, מוניטין מקוון