Clear Sky Science · ar

استخدام التعلم الآلي والصوت لتصنيف متعدد الفئات لمرض باركنسون ومرض الانسداد الرئوي المزمن والأصحاء

· العودة إلى الفهرس

الاستماع إلى المرض عبر الصوت البشري

نادراً ما نفكر في مدى ما تكشفه أصواتنا عن صحتنا. ومع ذلك، قد تحمل التغيرات الدقيقة في النبرة أو الثبات أو اللهاث دلائل حول اضطرابات تؤثر على الدماغ والرئتين. تستقصي هذه الدراسة ما إذا كانت تسجيلات قصيرة لشخص يحافظ على صوت العلة "آه" عبر هاتف ذكي، بالاقتران مع تقنيات التعلم الآلي الحديثة، قادرة على التمييز بين المصابين بمرض باركنسون، وأولئك المصابين بمرض الانسداد الرئوي المزمن (COPD)، وكبار السن الأصحاء.

Figure 1. أصوات مصوّتة بسيطة مسجلة بالهاتف تدخل في نموذج يصنّف الأصوات إلى مجموعات باركنسون أو الانسداد الرئوي المزمن أو الأصحاء.
Figure 1. أصوات مصوّتة بسيطة مسجلة بالهاتف تدخل في نموذج يصنّف الأصوات إلى مجموعات باركنسون أو الانسداد الرئوي المزمن أو الأصحاء.

لماذا يؤثر باركنسون والانسداد الرئوي المزمن على طريقتنا في النطق

يشتهر مرض باركنسون بالرجفة والتيبس، لكنه غالباً ما يجعل الكلام أهدأ وأكثر رتابة وأقل وضوحاً. أما الانسداد الرئوي المزمن، وهو مرض رئوي طويل الأمد، فيضيّق الممرات الهوائية ويعرقل التنفس، مما قد يجعل الصوت ضعيفاً أو خشناً أو مليئاً باللهاث. على الرغم من أن كلا المرضين يعطلان فعل إنتاج الصوت البسيط، إلا أن الأطباء ما زالوا يفتقرون إلى فحوصات سريعة وموضوعية مبنية على الصوت. معظم الأبحاث السابقة طلبت من الحواسيب أن تقرر فقط بين "مريض" و"سليم"، عادة لمرض واحد في كل مرة وضمن لغة واحدة. بدلًا من ذلك، طرح المؤلفون سؤالاً أصعب وأكثر واقعية: هل يمكن لنظام واحد أن يسمع أصوات كلام بسيطة جداً، بلغات مختلفة، ويصنف الأشخاص إلى ثلاث مجموعات في آن واحد؟

كيف جمع الباحثون وصقلوا الأصوات

جمع الفريق مجموعتين كبيرتين من التسجيلات الصوتية المسجلة على أجهزة محمولة. الأولى، من مشروع mPower، احتوت على متحدثين بالإنجليزية مصابين بباركنسون ومتطوعين أصحاء. والثانية، المسماة COPDVD، احتوت على متحدثين بالسويدية مصابين بالانسداد الرئوي المزمن وضوابط صحية مطابقة. لجعل المجموعات قابلة للمقارنة، اختار الباحثون بعناية أعداداً متشابهة من الرجال والنساء بعمر وعدد تسجيلات مقارب، ليصلوا في النهاية إلى 96 شخصاً و1,723 تسجيلاً صالحاً لصوت "آه" المستمر. أزالوا المقاطع الصامتة، ثم حوّلوا كل تسجيل إلى وصف مكوّن من 102 رقماً يلتقط مقاييس صوتية أساسية مثل النغمة والخشونة، وكذلك بصمات طيفية مفصلة تعرف بمعاملات كيبسترال التردد الميلّي (MFCC).

Figure 2. صوت واحد يتحول إلى أنماط صوتية، يمر عبر أربعة نماذج تصوّت معاً، وينتهي كمجموعات صوتية مفصولة ثلاثية.
Figure 2. صوت واحد يتحول إلى أنماط صوتية، يمر عبر أربعة نماذج تصوّت معاً، وينتهي كمجموعات صوتية مفصولة ثلاثية.

تعليم لجنة تصويت من الخوارزميات للاستماع

بدلاً من الاعتماد على طريقة تعلم آلي واحدة، بنى الباحثون "لجنة تصويت" مؤلفة من أربعة مصنفات مختلفة. استمعت كل خوارزمية إلى مجموعة ميزات التسجيل وأنتجت تخمينها الخاص عما إذا كان التسجيل يعود لباركنسون أو الانسداد الرئوي المزمن أو ضابط صحي، مع احتمال لكل خيار. ثم تمّ متوسط هذه الاحتمالات بحيث يعكس الجواب النهائي إجماع المجموعة. ولتجنب خداع أنفسهم بالإفراط في التخصيص، استخدم الفريق استراتيجية تدريب صارمة: تم ضبط النماذج واختبارها مرات عدة على طيات منفصلة من البيانات، وأُقيم الأداء النهائي على مجموعة منفصلة تمامًا من الأشخاص الذين لم ترَ الخوارزميات تسجيلاتهم أثناء التدريب.

ما استمعت إليه النظام داخل الأصوات

على مجموعة الاختبار المستقلة هذه، حقق التجميع نحو 84 بالمئة دقة عامة ودرجة F1 متوازنة أقل بقليل من 0.84، مما يعني أنه أدّى جيداً عبر المجموعات الثلاث على الرغم من اختلاف أحجام العينات. كان النظام بارعاً بشكل خاص في اكتشاف مرض باركنسون، الذي أظهر أعلى دقة واستدعاء. صُنفت الأصوات الصحية بنجاح متوسط، فيما كانت أصوات المصابين بالانسداد الرئوي المزمن الأصعب في التعرف وغالباً ما خُلطت مع التسجيلات الصحية. ومن اللافت أن باركنسون والانسداد الرئوي المزمن نادراً ما خُلطا ببعضهما البعض، مما يشير إلى أن توقيعاتهما الصوتية، رغم أنها شاذة في الحالتين، تختلف بطرق أمكن للخوارزميات اكتشافها. عندما فحص الباحثون كيف تملأ الحروف المصوّتة "المساحة" الصوتية المحددة بتردّداتها الرنينية، وجدوا تحولات وانتشارات دقيقة ولكن متسقة بين المجموعات الثلاث، حتى مع اختلاف اللغات.

نظرة داخل الصندوق الأسود

لفهم ما وجه قرارات النظام، استخدم الفريق أداة تفسير حديثة تمنح درجة تأثير لكل ميزة صوتية. واكتشفوا أن الصفات الصوتية الأكثر أهمية ليست هي نفسها لكل مجموعة. العمر، والأشكال الطيفية المفصلة، ومقاييس متعلقة بالنغمة كلها كانت ذات وزن، ولكن بتراكيب مختلفة لباركنسون والانسداد الرئوي المزمن والأصحاء. على سبيل المثال، كانت بعض المواصفات الطيفية وأنماط الفورمانت أكثر تأثيراً في الانسداد الرئوي المزمن، بينما لعبت مؤشرات طيفية ونغمية معينة دوراً أقوى في باركنسون. يوحي هذا النمط بأن النموذج تعلم فعلاً جوانب خاصة بكل مرض في طريقة إنتاج الأشخاص لحرف علة مستمر، بدلاً من اكتشاف أن الصوت "غريب" فحسب.

ماذا قد يعني هذا للرعاية اليومية

بعبارة بسيطة، تُظهر هذه الدراسة أن صوت "آه" قصير ومستمر مسجّل على جهاز محمول عادي قد يحتوي على معلومات كافية لنظام تعلم آلي مصمّم بعناية لتمييز بين مشكلات صوتية متعلقة بالدماغ أو بالرئتين والأصوات الناتجة عن الشيخوخة الطبيعية. هذه المقاربة لا تحل محل التشخيص الطبي، وهناك حاجة لدراسات أكبر وأكثر تنوعًا، لكنها تشير إلى مستقبل يمكن أن تدعم فيه فحوصات صوتية سريعة وغير باضعة الأطباء في فحص ومتابعة المصابين بباركنسون أو الانسداد الرئوي المزمن، حتى عبر لغات وسياقات مختلفة.

الاستشهاد: Idrisoglu, A., Behrens, A. Use of machine learning and voice for multiclass classification of Parkinson’s disease, chronic obstructive pulmonary disease, and healthy controls. Sci Rep 16, 15485 (2026). https://doi.org/10.1038/s41598-026-53409-3

الكلمات المفتاحية: مرض باركنسون, الانسداد الرئوي المزمن, علامة حيوية صوتية, التعلم الآلي, الصحة المتنقلة