Clear Sky Science · he
מודליזציה של אי-ודאות בניתוח דיבור רב־מצבי לאורך ספקטרום הפסיכוזה
להאזין לרמזים נסתרים בשפה היומיומית
לעתים תופסים פסיכוזה כסיטואציה פתאומית ודרמטית — קולות, חזיונות ושבירה מהמציאות. אבל הרבה לפני משבר, שינויים עדינים עלולים להופיע באופן שבו אנשים מדברים: הטון, בחירת המילים ואפילו קצב המשפטים. המחקר הזה בוחן האם מחשבים יכולים לקלוט אותות חלשים אלה בדיבור ובנוסף להעריך עד כמה הם בטוחים במה ששומעים. בכך הוא מצביע על כלי עתידי שעשוי לסייע לאנשי מקצוע לעקוב אחר מצבים נפשיים באופן אובייקטיבי יותר ולמקד טיפול לאורך טווח שבין סיכון קל למחלה ממושכת.
מדיבור יומי לשיחות קליניות
החוקרים הקליטו דיבור מ־114 מתנדבים דוברי גרמנית המכסים את ספקטרום הפסיכוזה: אנשים עם הפרעות פסיכוטיות מוקדמות ואנשים ללא אבחנה אך עם רמות נמוכות או גבוהות של תכונות הדומות לפסיכוזה (שנקראות שיזוטיפיה). כל אדם ביצע ארבע משימות דיבור שונות, משיחות קליניות ממוסדות ועד סיפורים אוטוביוגרפיים חופשיים, סיפור תמונה ושיחה יומיומית. ההקשרים השונים חשובים כי ראיון מודרך יכול לחשוף תסמינים מסוימים — כמו שיטיון רגשי — בעוד שנרטיבים פתוחים עשויים להראות תזוזות מחשבה או תפיסות יוצאות דופן. בדגימה ממשתנים אלה, הצוות יכול היה לבדוק עד כמה הדיבור מסמן תסמינים במצבים הדומים לעולם האמיתי.

לשמוע גם איך מדברים וגם מה אומרים
המערכת במחקר מאזינה לשני היבטים של הדיבור בו־זמנית. מצד הצליל היא עוקבת אחר מאפיינים כגון שינויים בגובה הצליל, בעוצמה ובמבנה העדין של הקול, שמגלמים יחד הבעה, מתח וזרימת דיבור. מצד השפה היא מנתחת את המילים עצמם — עד כמה הן רגשיות, האם הן מתמקדות בתפיסות או בקשרים חברתיים, ועד כמה הן קוהרנטיות. רשתות נוירונים מתקדמות, שאומנו במקור על אוספי אודיו וטקסט גדולים, ממירות את האותות הגולמיים לטביעות מספריות דחוסות. המודל המרכזי מאחד את הטביעות האלה לאורך זמן כדי להעריך, רגע אחר רגע, איזה ערוץ — קול או שפה — מספק רמז מהימן יותר לגבי המצב הנפשי של האדם.
ללמד את המודל להודות בחוסר וודאות
מה שמבדיל עבודה זו הוא שהמודל לא רק נותן חיזוי; הוא גם מעריך את רמת חוסר הוודאות שלו. במקום להתייחס לזרמי האודיו והטקסט כאל קבועים, הוא מייצג אותם כענני הסתברות שיכולים להתרחב כשהנתונים רועשים או בלתי שגרתיים. אם ההקלטה מעוותת או שהמישהו מלמלה, המערכת מפחיתה ממשקל הצד הקולי ומסתמכת יותר על המילים. אם התמלול אינו אמין או שהדיבור מפורק בצורה קיצונית, היא עושה ההפך. האיחוד המודע לאי־וודאות הזה, שנקרא Temporal Context Fusion, השיג ביצועים טובים: הוא הפריד בין קבוצות של שיזוטיפיה נמוכה, שיזוטיפיה גבוהה ופסיכוזה מוקדמת עם F1 של 83% והראה כי הביטחון המוצהר שלו היה מכויל היטב — כלומר רמת ההסתברות שהוא נתן תאמה בתדירות גבוהה לאותו שיעור בו הוא היה נכון בפועל.

דפוסי דיבור המשקפים סוגי תסמינים שונים
על ידי חקירת פעולת המודל מבפנים, זיהו החוקרים אילו היבטים של הדיבור עקבו בעקביות אחרי ממדי תסמינים שונים. אנשים עם תסמינים חיוביים חזקים יותר — כגון חוויות בלתי רגילות או רעיונות מרושעים — נטו להציג גובה צליל גבוה ומשתנה יותר, שינויים מהירים בספקטרום הקול וגלי עוצמה גדולים יותר, במיוחד בסיפורים פתוחים. השפה שלהם כללה גם הרבה מילות תפיסה (שקשורות בראייה, שמיעה או חישה) ומונחים טעונים רגשית. לעומת זאת, אנשים עם תסמינים שליליים מוחלשים — כגון נסיגה חברתית ושטיפת רגשות — דיברו בצורה מונוטונית יותר, עם טווח גבהים מוגבל וארטיקולציה פחות גמישה, והשתמשו בפחות מילים של רגש חיובי ומילות חברתיות. תכונות מבולגנות, גם אצל מטופלים וגם אצל מתנדבים עם שיזוטיפיה גבוהה, התגלו כעוצמת קול לא יציבה, היסוסים ושפה מפורקת שמלאה במילים הקשורות לסיכון ותהליכי חשיבה, מרמזת על מאמץ מנטלי ללא מבנה ברור.
מדוע זה חשוב לטיפול נפשי עתידי
במבט כולל, הממצאים מראים כי בדיבור קיימים סימנים ניתנים למדידה של תכונות הקשורות לפסיכוזה אפילו אצל אנשים שאינם חולים קלינית, ושהסימנים הללו משתנים בהתאם לסיטואציית הדיבור. המודל המודע לאי־וודאות הצליח לנצל גם צליל וגם שפה כדי לעקוב אחרי תכונות חיוביות, שליליות ומבולגנות לאורך הרצף, ובמקביל להודיע בגלוי כשהראיות חלשות. למשתמש שאינו מקצועי, הרעיון המרכזי הוא שהאזנה מדוקדקת — המוגברת על ידי בינה מלאכותית שיודעת את מגבלותיה — יכולה בסופו של דבר לסייע לאנשי מקצוע לעקוב אחרי בריאות הנפש באופן יותר אובייקטיבי, להפחית ניחושים ולזהות שינויים משמעותיים מוקדם יותר. כלים כאלה לא יחליפו את שיקול הדעת האנושי, אלא ישמשו כמקבילה נוספת — סט אוזניים נוסף — המדגיש תבניות בדיבור היומיומי שראויות לבחינה מעמיקה יותר.
ציטוט: Rohanian, M., Hüppi, R., Nooralahzadeh, F. et al. Uncertainty modeling in multimodal speech analysis across the psychosis spectrum. npj Digit. Med. 9, 218 (2026). https://doi.org/10.1038/s41746-025-02309-3
מילות מפתח: פסיכוזה, ניתוח דיבור, למידת מכונה, הערכה של בריאות הנפש, בינה רב־מצבית