Clear Sky Science · he

מאגר תובנות על תפיסת חוויית משתמש (UXPID): משוב משתמשים סינתטי מפורומים תעשייתיים ציבוריים

2026-05-20 · חזרה לאינדקס

מדוע שיחות טכניות מקוונות חשובות

כל יום אנשים ברחבי העולם מפרסמים שאלות ותלונות בפורומי תמיכה של חברות כאשר התוכנה או המכשירים התעשייתיים שלהם מתנהגים בצורה בעייתית. בתוך השרשורים הללו חבויים עושר של תובנות על מה שמשתמשים אמיתיים מתקשים בו, מה הם אוהבים ומה הם עדיין זקוקים לו. יחד עם זאת, המידע הזה מבולגן, מפוזר ולעתים חסום על ידי כללי פרטיות. מאמר זה מציג דרך חדשה לנגוס בידע המוסתר הזה מבלי לחשוף פרטים אישיים של אף אחד.

Figure 1. כיצד דיונים אמיתיים בפורומים משתמשים הופכים למאגר נתונים בטוח ומובנה ללימוד חוויית מוצר בקנה מידה

הפיכת שיח פורומים לדלק מחקרי

המחברים מציגים את מאגר תובנות תפיסת חוויית המשתמש, או UXPID, אוסף גדול של דיונים סינתטיים של משתמשים המבוססים על פורום אוטומציה תעשייתית ציבורי. במקום לשתף את הפרסומים המקוריים, שעשויים להכיל שמות, קודי מוצר ופרטי חברה, הם יצרו ניסוחים זהירים שמאזנים בין שמירה על המשמעות לבין הסרת רמזים רגישים. כל רשומה מתארת ענף שיחה שלם, החל משאלת המשתמש וכלה בכל התשובות, כך שחוקרים יכולים לראות לא רק תגובות בודדות אלא שיחות פתרון בעיות שלמות.

הוספת מבנה לשיחות מבולגנות

מה שמבדל את UXPID הוא המבנה העשיר שהתווסף על טקסט גולמי. הצוות השתמש במודל שפה חזק שקרא כל דיון ויצר סיכומים של הבעיה המרכזית, מה המשתמש ציפה שיקרה וכמה החומרה נראתה. בנוסף, סומנו כל ענף בנושאים, צוין האם הטון היה חיובי, שלילי או נייטרלי, ונדגמו ביטויים קצרים המתארים כאבים, רווחים ותכונות מבוקשות. זאת הופכת שיח חופשי למידע מאורגן שמחשבים יכולים ללמוד ממנו.

Figure 2. כיצד הערות גולשים גולמיות מנותחות ומאונפות שלב אחר שלב כדי ליצור נתונים מתוייגים למודלי בינה מלאכותית

שמירה על אנונימיות בזמן שמירת התוכן

הגנה על משתתפי הפורומים הייתה מטרה מרכזית. המודל הונחה להחליף שמות חברות, תוויות מוצר, מספרי גרסה, שמות אישיים, אימיילים וקישורים באינטרנט במספרי מקום פשוטים תוך שינוי ניסוח קל של כל תגובה. לאחר המעבר האוטומטי, הצוות הריץ זיהוי תבניות כדי ללכוד רמזים שנותרו כגון פורמטי אימייל או IP, ולאחר מכן בדק דגימות ידנית. הם גם השוו בין הטקסטים המקוריים לעיבודיים והראו שאורך המשפטים והמגוון נשארו דומים, אף על פי שהצעקה באותיות רישיות ורצפי סימני קריאה מתווסתו.

ניסיון המאגר במבחן

כדי לבדוק האם המאגר החדש אכן שימושי, המחברים אימנו שני סוגי מודלים עליו. אחד היה גישה קלאסית של ספירת מילים, והשני היה מודל טרנספורמר מודרני הידוע כ-DistilBERT שיכול לתפוס הקשר במשפטים. הם ביקשו מהמודלים לנחש את תוויות הנושא ואת המצב רוח הכללי של כל דיון. הטרנספורמר הציג ביצועים טובים באופן עקבי, במיוחד למקרים מסובכים עם מספר נושאים, מה שמרמז ש-UXPID עשיר מספיק לתמוך בכלים לשוניים מתקדמים למשימות כמו זיהוי בעיות וניתוח סנטימנט.

מה המשמעות לכלים עתידיים

בקיצור, המאמר מראה שאפשר להפוך שרשורים רעשיים ופרטיים במפורומים למשאב נקי ושמיש שמשקף עדיין שימוש אמיתי במוצר. UXPID מציע אלפי שיחות מתומללות ומאובטחות שאחרים יכולים להשתמש בהן כדי לבנות ולהשוות מערכות שקוראות ומבינות משוב משתמשים בקנה מידה. זה יכול להוביל לכלי תמיכה חכמים יותר, להחלטות עיצוב מוצר טובות יותר ולדרכים חדשות לזהות דפוסים בחוויית הלקוח, כל זאת תוך כיבוד פרטיות הכותבים המקוריים.

ציטוט: Kulyabin, M., Joosten, J., Ulan uulu, C. et al. User eXperience Perception Insights Dataset (UXPID): Synthetic User Feedback from Public Industrial Forums. Sci Data 13, 762 (2026). https://doi.org/10.1038/s41597-026-07253-9

מילות מפתח: משוב משתמשים, פורומים טכניים, עיבוד שפה טבעית, מאגר סינתטי, חוויית משתמש