Clear Sky Science · he

לקסיקון אישיות סטנדרטי לשיפור אינטראקציה מותאמת אישית בין אדם למכונה

· חזרה לאינדקס

מדוע המילים שבהן אנחנו מדברים על עצמנו חשובות

כשאתה משוחח עם עוזר וירטואלי, גולל ברשתות חברתיות או ממלא טופס מקוון, השפה שבה אתה משתמש חושפת בעדינות דפוסים באישיות שלך. מאמר זה מתאר כיצד חוקרים בנו מאגר מילים רב ומנוסה הקשור לאישיות בסינית (עם גרסה תואמת באנגלית). משאב זה מסייע למחשבים להבין טוב יותר תכונות יציבות של אנשים — כמו עד כמה הם חברותיים, מודאגים או פתוחים לחוויות — כך שכלים דיגיטליים יכולים להגיב באופן אישי, מועיל ואפילו תומך נפשית יותר.

מתכונות יומיומיות לחמש תמות מרכזיות

פסיכולוגים מתארים לעתים קרובות את האישיות באמצעות "חמשת הגורמים": מידת הנטייה לדאגה (נוירוטיות), מידת החיצוניות (אקסטרוורסיה), הסקרנות והדמיון (פתיחות), החמימות ושיתוף הפעולה (נעימות) והאמינות והארגון (מישמעת/מצפוניות). כל אחד מהתכונות הרחבות האלה מתחלק עוד לשש תתי-מימדים מדויקים יותר, כגון עליזות תחת אקסטרוורסיה או אמון תחת נעימות. כי האישיות ניכרת היטב במילים שאנשים בוחרים, מפת מילים מדויקת שמקשרת מילים לתכונות אלה יכולה להעניק למחשבים חלון אל הייחודיות האנושית — במיוחד בשפות כמו סינית, שבהן הכלים הקיימים היו מוגבלים או לא נבדקו דיים.

בניית מפת ענק של מילים אישיותיות

החוקרים התחילו באיסוף "מילות זרע" ממקורות מהימנים רבים. הם סרקו שאלוני אישיות ידועים כגון IPIP-NEO, NEO-PI-R ו-BFI, טפסי דירוג קצרים, סולמות תארים אישיותיים סיניים ומדדים קלאסיים נוספים. הוסיפו מילים מתוך מילונים פסיכולוגיים כמו LIWC וקבוצת תארים אישיותיים גדולה, ולאחר מכן הוסיפו מונחים מתוך מחקרים עדכניים וציטוטיים שקישרו מילים ספציפיות לתכונות אישיות. לאחר הסרת כפילויות נותרו 6,084 תארים ייחודיים הקשורים לאישיות. כל מילה נשמרה בצורה הסינית המקורית שלה או תורגמה בקפידה מאנגלית, ויצרה בסיס חוצה-שפות משותף.

Figure 1
Figure 1.

תיוג רגשות ותתי-מימדים

בהמשך, חוקרים פסיכולוגים מאומנים שיוכו כל מילה לאחד מחמשת ממדי חמשת הגורמים ולאחת מ-30 התתי-מימדים העדינים יותר, תוך שימוש בהגדרות סטנדרטיות מ-IPIP-NEO-120. הם גם שיפטו האם לכל מילה יש גוון רגשי חיובי, שלילי או ניטרלי — האם היא רומזת לתכונה רצויה כמו "אמין", לא רצויה כמו "אימפולסיבי" או לתכונה ניטרלית יותר. זה יצר מערכת תג-שכבתית ועשירה: לכל מילה יש כעת מקום בחתיכה מסוימת של מרחב האישיות וטון רגשי שמשדר כיצד הדבר עשוי להיתפס על ידי המתואר.

בדיקת המילון עם אנשים אמיתיים

כדי לצאת מעבר לדעת מומחים בלבד, הצוות ערך שתי סבבי מחקר מקוונים. מתנדבים בגילאי 18–65 השלימו שאלון חמשת הגורמים הסטנדרטי ואז דרגו עד כמה תארים שונים מתאימים להם, באמצעות סקאלה פשוטה 0–4. ניסוי פיילוט עם 50 אנשים שיפר את התהליך; מחקר עיקרי גדול יותר עם 329 משתתפים סיפק את העדויות המשמעותיות. עבור כל מילה, החוקרים השוו עד כמה היא הדהדה אצל אנשים עם ציונים גבוהים או נמוכים בתכונה התואמת. אם, למשל, אנשים עם ציוני-נעימות גבוהים אישרו בעקביות מילים חיוביות הקשורות לידידות, ואילו בעלי ציונים נמוכים לא — המילה נחשבה "פגיעה טובה". בכל ממדי חמשת הגורמים שיעורי ה"פגיעה" עמדו על מעל 0.70, ובכל 30 התתי-מימדים מעל 0.60, מה שמראה שהמילון לכד הבדלים אישיותיים אמיתיים ולא השערות רופפות.

Figure 2
Figure 2.

מה זה אומר לצ'אטבוטים ולבריאות הנפש

מכיוון שלקסיקון האישיות הזה פתוח, מפורט ומאומת באמצעות נתונים אמיתיים, הוא יכול להניע יישומים מעשיים כבר עכשיו. צ'אטבוטים יכולים להתאים את סגנונם על סמך תכונות המשתמש הסבירות — למשל להירגע יותר עם משתמשים חרדתיים או להיות תמציתיים יותר עם אנשים מאוד מסודרים. אנליסטים יכולים לסרוק פוסטים ברשתות החברתיות כדי לזהות דפוסים המקושרים לנוירוטיות גבוהה או למצפוניות נמוכה, שעלולים להתייחס לסיכונים לבעיות בריאות נפשית, ולספק דרך לא פולשנית לזהות אנשים שעשויים להרוויח מתמיכה. ומודלים לשוניים גדולים יכולים לכוונן את ההנחיות (prompts) שלהם כך שיכבדו פרופילים אישיותיים שונים, ועוזרים למערכות דיגיטליות להרגיש פחות גנריות ויותר מותאמות לפרט.

הוספת נופך אנושי למכונות

במונחים יומיומיים, עבודה זו הופכת אלפי מילים שמתארות אישיות למפה מהימנה שמחשבים יכולים לקרוא. על ידי קשירת כל מילה לתכונות שנחקרו היטב ובחינת הקישורים האלו מול האופן שבו אנשים אמיתיים מדברים על עצמם, החוקרים יצרו גשר יציב בין הפסיכולוגיה לטכנולוגיית שפה. כתוצאה מכך, אפליקציות, צ'אטבוטים וכלים מקוונים עתידיים יוכלו להגיב בצורה שמתאימה יותר למי שאנחנו, ולהציע אינטראקציות שאינן רק חכמות יותר, אלא גם מודעות יותר להיבט האנושי.

ציטוט: Jin, T., Cai, H., Shi, X. et al. A standardized personality lexicon for enhancing personalized human-machine interaction. Sci Data 13, 579 (2026). https://doi.org/10.1038/s41597-026-06783-6

מילות מפתח: לקסיקון אישיות, חמשת הגורמים המרכזיים, עיבוד שפה טבעית, צ’אטבוטים מותאמים אישית, נתונים בשפה הסינית