Clear Sky Science · ar

نمذجة عدم اليقين في تحليل الكلام المتعدد الوسائط عبر طيف الذُهان

· العودة إلى الفهرس

الاستماع إلى دلائل خفية في الكلام اليومي

غالباً ما يُتصور الذهان على أنه حدث مفاجئ ودرامي — أصوات، رؤى، وانفصال عن الواقع. لكن قبل حدوث الأزمة بوقت طويل، قد تظهر تغيّرات دقيقة في طريقة حديث الأشخاص: نبرة صوتهم، اختياراتهم للكلمات، حتى إيقاع جملهم. تستكشف هذه الدراسة ما إذا كانت الحواسيب قادرة على التقاط تلك الإشارات الخافتة في الكلام، والأهم من ذلك أن تُقدّر مدى ثقتها في ما تسمعه. وبذلك، تشير الدراسة إلى أدوات مستقبلية قد تساعد الأطباء على تتبُّع الصحة النفسية بشكل أكثر موضوعية وتخصيص الرعاية عبر نطاق كامل يمتد من المخاطر الطفيفة إلى المرض الكامل.

من الحديث العابر إلى المقابلات السريرية

سجّل الباحثون كلام 114 متطوعاً ناطقين بالألمانية يغطيون طيف الذهان: أشخاصاً يعانون اضطرابات ذهانية مبكرة وأفراداً دون تشخيص لكن ذوي مستويات منخفضة أو مرتفعة من خواص شبيهة بالذهان (المعروفة بالشيزوتيبية). أكمل كل مشارك أربعة أنواع من مهام الكلام، من مقابلات سريرية مهيكلة إلى قصص سير ذاتية أكثر انسيابية، وسرد قصص مستند إلى صور، وحديث يومي. تهم هذه السياقات المختلفة لأن المقابلة الموجّهة بإحكام قد تبرز أعراضاً معينة، مثل الانFlatالعاطفي، بينما قد تكشف السرديات المفتوحة عن تشتت الأفكار أو تصورات غير عادية. من خلال أخذ عينات عبر سياقات متعددة، تمكن الفريق من تقييم مدى موثوقية إشارة الكلام للأعراض في مواقف شبيهة بالواقع.

Figure 1
Figure 1.

الاستماع إلى كيفية حديثنا وماذا نقول

يستمع نظام الدراسة إلى جانبي الكلام معاً. على جانب الصوت، يتتبع مميزات مثل تغيرات النغمة، والحدة، والبنية الدقيقة للصوت، والتي تلتقط معاً التعبير، والتوتر، والطلاقة. وعلى جانب اللغة، يحلل الكلمات نفسها — مدى عاطفيتها، إن كانت تركز على الإدراك أو العلاقات الاجتماعية، ومدى اتساقها. تحول الشبكات العصبية المتقدمة، المدربة أصلاً على مجموعات ضخمة من الصوت والنص، هذه الإشارات الخام إلى بصمات رقمية مضغوطة. ثم يدمج النموذج الأساسي هذه البصمات عبر الزمن حتى يتمكن، لحظة بلحظة، من أن يقيم أي قناة — الصوت أم اللغة — تقدم الدليل الأكثر موثوقية عن الحالة النفسية للشخص.

تعليم النموذج أن يعترف عندما يكون غير متأكد

ما يميز هذا العمل هو أن النموذج لا يكتفي بإخراج توقع؛ بل يقدّر أيضاً عدم اليقين الخاص به. بدلاً من التعامل مع تدفقات الصوت والنص كقيم ثابتة، يمثلها كسحب احتمالية يمكن أن تتسع عندما تكون البيانات مشوشة أو غير مألوفة. إذا كان تسجيل الصوت مشوهاً أو المتحدث يتمتم، يقلل النظام من وزن الصوت ويعتمد أكثر على الكلمات. وإذا كانت النسخ المكتوب غير موثوق أو كان الكلام مفككاً للغاية، يفعل العكس. حقق هذا الاندماج الواعٍ لعدم اليقين، المسمى الاندماج السياقي الزمني، أداءً قوياً: فقد امتاز بتمييز مجموعات الشيزوتيبية المنخفضة، والشيزوتيبية المرتفعة، والذهان المبكر بمقياس F1 بلغ 83٪ وأظهر ثقة جيدة المعايرة، بمعنى أن درجة اليقين المعلنة كانت متقاربة مع مدى صحة تنبؤاته في الواقع.

Figure 2
Figure 2.

أنماط الكلام التي تعكس أنواع أعراض مختلفة

من خلال فحص آليات عمل النموذج، حدد الباحثون أي جوانب الكلام تتبع بانتظام أبعاد أعراض مختلفة. الأشخاص ذوو الأعراض الإيجابية الأكثر حدة — مثل التجارب غير الاعتيادية أو الأفكار الوهمية — أظهروا ميلاً إلى ارتفاع وتفاوت أكبر في النغمة، وتحولات سريعة في طيف الصوت، وتقلبات أكبر في الشدة، لا سيما في السرد الحر. كما احتوت لغتهم على كلمات إدراكية كثيرة (مرتبطة بالرؤية أو السمع أو الإحساس) ومصطلحات محمّلة عاطفياً. بالمقابل، تحدث الأشخاص ذوو الأعراض السلبية الأقوى — مثل الانسحاب الاجتماعي وتبلد المشاعر — بطريقة أكثر رتابة، بنطاق نغمي مقيد وتلفظ أقل مرونة، واستخدموا كلمات أقل تعبيراً عن المشاعر الإيجابية والعلاقات الاجتماعية. ظهرت السمات المبعثرة، لدى المرضى والمعنيين بالشيزوتيبية العالية، على شكل عدم استقرار في الشدة، وتردّدات، ولغة مجزأة مليئة بكلمات تتعلق بالمخاطر والعمليات المعرفية، مما يوحي بجهد ذهني دون بنية واضحة.

لماذا يهم هذا لرعاية الصحة النفسية في المستقبل

تُظهر النتائج مجتمعة أن الكلام يحمل أثرًا قابلاً للقياس لسمات مرتبطة بالذهان حتى لدى أشخاص ليسوا مرضى سريريًا، وأن هذه الآثار تتغير اعتمادًا على سياق الحديث. استطاع النموذج الواعي لعدم اليقين أن يستفيد من الصوت واللغة معاً لتتبُّع السمات الإيجابية والسلبية والمبعثرة على امتداد طيف، مع الإشارة صراحة عندما تكون الأدلة غير متينة. للفرد العادي، الفكرة الأساسية هي أن الاستماع الدقيق — معزَّز بذكاء اصطناعي يدرك حدوده — قد يساعد في نهاية المطاف الأطباء على مراقبة الصحة النفسية بشكل أكثر موضوعية، وتقليل التخمين، واكتشاف التغيرات الهامة مبكراً. وبدلاً من استبدال الحكم البشري، يمكن أن تعمل مثل هذه الأدوات كزوج من الأذنين الثانية، مبرزًا أنماطًا في الكلام اليومي تستحق اهتمامًا أعمق.

الاستشهاد: Rohanian, M., Hüppi, R., Nooralahzadeh, F. et al. Uncertainty modeling in multimodal speech analysis across the psychosis spectrum. npj Digit. Med. 9, 218 (2026). https://doi.org/10.1038/s41746-025-02309-3

الكلمات المفتاحية: الذهان, تحليل الكلام, تعلم الآلة, تقييم الصحة النفسية, الذكاء الاصطناعي متعدد الوسائط