Clear Sky Science · he

מאגר מאומת של דיבור שמיעתי בסינית מנדרינית של משפטים עם כינויי גוף (MCAE-SPPS)

· חזרה לאינדקס

למה מילים פשוטות כמו «אני» ו«את/אתה» חשובות

ביטויים יומיומיים כגון «יש לי תוכנית» או «עשית טוב» נושאים יותר ממידע בלבד — הם מעבירים גם רגש. שינויים עדינים במי מדבר על מי יכולים לעצב את הדרך שבה אנו שומעים ומפרשים רגשות בקול. המחקר הזה מציג מאגר קולות גדול ובדיקת איכות קפדנית של משפטים בסינית מנדרינית שמרכזים סביב כינויי גוף כמו «אני», «את/אתה» ו«הוא/הם». המטרה היא לסייע למדענים, קלינאים ומהנדסים להבין טוב יותר כיצד בחירת הכינוי משפיעה על התפיסה הרגשית ולפתח כלים חכמים יותר למערכות בריאות הנפש ותקשורת בין אדם למכונה.

בניית מאגר של קולות רגשיים

ליצירת המשאב הזה, החוקרים כתבו תחילה 40 משפטים קצרים וניטרליים מבחינה רגשית בסינית מנדרינית, כולם בדפוס פשוט כמו «יש לי תוכנית». הם אישרו בעזרת מעריכים עצמאיים שהמשפטים נתפסים כניטרליים ולא כשמחים או עצובים. לאחר מכן החליפו את מילת הנושא כדי ליצור שישה גרסאות לכל משפט — «אני», «אנחנו», «את/אתה» יחיד, «אתם/אתן» רבים, «הוא» ו«הם» — תוך שמירה על שאר המשפט ללא שינוי. זה הניב 200 משפטי בסיס ניטרליים, שכל אחד מהם שונה אך ורק בכינוי, כך שכל שינוי בתפיסת הרגש ניתן לייחס למילה הבודדת הזו.

הפיכת משפטים ניטרליים לדיבור רגשי

שישה שחקנים דוברי מנדרינית מאומנים היטב — שלושה גברים ושלוש נשים — הקליטו כל משפט בשבע סגנונות רגשיים: ניטרלי, שמחה, עצב, כעס, פחד, גועל והפתעה. משמעות הדבר שכל שחקן הפיק 1,400 הקלטות, לסך כולל של 8,400 קליפים. ההקלטות התקיימו באולפן מקצועי וערוכו והמוּנָתו בזהירות כדי להבטיח איכות צליל עקבית. לאחר הסרת מספר קטן של קליפים שסבלו מבעיות טכניות או הגייה, נותרו 8,379 אמירות שנבדקו על ידי המאזינים.

Figure 1
Figure 1.

כיצד המאזינים שפטו את הרגשות בקול

כדי לברר עד כמה כל קליפ הביע רגש בבירור, הצוות גייס 720 סטודנטים סיניים. כל משתתף האזין לכמה מאות קליפים ברשת ובכל פעם בחר באיזה מבין שבעת הרגשות הוא שומע וכמה חזקה הייתה התחושה בסולם בן תשע נקודות. כל קליפ נשפט על ידי 40 מאזינים שונים, מה שסיפק תמונה עשירה של עד כמה אנשים הכירו בעקביות את הרגש המיועד. החוקרים שמרו רק את ההקלטות שנזוהו נכון לפחות פי שלוש מתוחלת המקריות ולא טושטשו לעתים קרובות על ידי רגש אחר. סינון איכות זה השאיר 6,675 הקלטות "תקפות", אשר עדיין כיסו את כל סוגי הרגשות והכינויי גוף.

מה הנתונים חושפים על רגשות וכינויי גוף

מאגר הסופי מראה כי חלק מהרגשות קל יותר לשמוע מאחרים: ניטרלי ועצב זוהו בדיוק הרב ביותר, בעוד פחד וגועל התבלבלו ביתר קלות. נשים, בממוצע, היו מעט יותר מדויקות מגברים בזיהוי הרגשות בדיבור. החשוב מכך, הצוות מצא שכינויי גוף משמעותיים: משפטים שפנו ל"את/אתה" נבדלו ממשפטים בגוף שלישי על "הוא" או "הם" בכל הרגשות, מה שמרמז שפנייה ישירה למאזין מחדדת את הבהירות הרגשית. בחירת הכינוי שינתה גם את העוצמה הנתפסת של הדיבור. לדוגמה, משפטים עם "את/אתה" נטו להרגיש חזקים יותר בעוצמת כעס ופחד, בעוד משפטים עם "אני" הרגישו אינטנסיביים יותר עבור שמחה וגועל. ניתוחים אקוסטיים קישרו עוד תכונות כמו טון גובה, עוצמת קול ואיכות הקול לאופן שבו כל רגש זוהה בדיוק.

Figure 2
Figure 2.

מדוע המשאב הזה חשוב להמשך

במילים פשוטות, העבודה הזו מראה שמילים קטנות כמו «אני» ו«את/אתה» יכולות לשנות לא רק את מה שאנו אומרים אלא גם עד כמה חזק נשמע הרגש שלנו. על ידי הצעת אלפי הקלטות מתוייגות בקפדנות שבהן משתנה אך ורק הכינוי והטון הרגשי, מאגר דיבור רגשי בסינית מנדרינית של משפטים עם כינויי גוף מספק לחוקרים כלי חזק לחקור כיצד שפה, רגש ופרספקטיבה חברתית מתקשרים. הוא יכול לתמוך בקידומים במחקר מוחי, בבינה מלאכותית רגישת רגש ובכלים קליניים שמאזינים לשינויים במצב הרוח או בבריאות הנפש, כולם מעוגנים בשאלה הפשוטה אך המעמיקה של מי מדבר על מי.

ציטוט: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z

מילות מפתח: דיבור רגשי, סינית מנדרינית, כינויי גוף, זיהוי רגשות, מאגר דיבור