Clear Sky Science · ar

ميزات التعلم العميق الهجينة وYAMNet لتشخيص الربو من الأصوات التنفسية

· العودة إلى الفهرس

الاستماع للتنفس بدلاً من النفخ في أنبوب

بالنسبة للملايين من الأشخاص المصابين بالربو، غالبًا ما يعني الحصول على تشخيص واضح زيارة العيادة وإجراء اختبارات وظائف الرئة التي قد تكون مرهقة وتستغرق وقتًا ويصعب تكرارها بانتظام. تستكشف هذه الدراسة فكرة مختلفة تمامًا: استخدام صوت تنفس الشخص أو سعالهم، مسجَّلًا بما هو بسيط مثل ميكروفون الهاتف أو سماعة صدر رقمية، لمعرفة ما إذا كان لديهم الربو أو حالة رئوية أخرى. من خلال تحويل هذه الأصوات إلى أنماط يمكن للكمبيوتر التعرف عليها، يهدف الباحثون إلى بناء أداة دقيقة وبأسعار معقولة قد تدعم في يوم من الأيام الفحوصات عن بُعد وتطبيقات الصحة المتنقلة.

Figure 1
الشكل 1.

لماذا تحمل أصوات التنفس دلائل خفية

يؤثر الربو على المجاري الهوائية، فيضيّقها ويجعل تدفق الهواء غير منتظم. هذا ينتج أصواتًا مميزة مثل الصفير (نغمات صفَّارية) والفرقعات (أصوات فرقعة قصيرة)، التي يستمع إليها الأطباء تقليديًا بواسطة السماعة الطبية. ومع ذلك، يمكن للأشخاص المصابين بأمراض رئوية أخرى—مثل مرض الانسداد الرئوي المزمن (COPD)، أو التهاب الشعب الهوائية، أو الالتهاب الرئوي—إنتاج أصوات مماثلة، ما يجعل التشخيص معقدًا حتى للمتخصصين. تتطلب الاختبارات القياسية مثل قياس التنفس بالقسطر (السبيرومترية) زيارات للعيادة وطاقمًا مدرَّبًا ومعدات خاصة، وقد تفوت تنوع أنماط الربو. يجادل المؤلفون بأن تحليل الأصوات التنفسية المسجَّلة بدقة يمكن أن يلتقط هذه الاختلافات الدقيقة بشكل أكثر ملاءمة وقد يساعد في التمييز بين عدة أمراض رئوية وكذلك التنفس السليم.

بناء مستمع ذكي لأصوات الرئة

صممت الفريق نظام "مستمع ذكي" يبدأ بتسجيلات من العالم الحقيقي من مجموعة بيانات عامة على Kaggle تسمى Asthma Detection Dataset v2. هذه مقاطع قصيرة للسعال والتنفس جُمِعت بواسطة هواتف محمولة عادية في بيئات يومية، ووسِّمت كحالات ربو أو COPD أو التهاب رئوي أو التهاب شعبي أو سليم. نظرًا لتفاوت طول وجودة التسجيلات، يقوم الباحثون أولًا بتنظيفها: توحيد مستوى الصوت، وإزالة الصمت الطويل، وترشيح الترددات المنخفضة جدًا والعالية جدًا، وتقسيم الصوت إلى مقاطع ثابتة مدتها ست ثوانٍ تكفي لالتقاط دورات التنفس الكاملة. كما ينشئون تنويعات واقعية—تسريع أو إبطاء طفيف للصوت، وتحويل طفيف في النغمة، وإضافة ضوضاء خلفية خفيفة—لتعليم النظام كيفية التعامل مع ظروف العالم الحقيقي المبعثرة بدلًا من التسجيلات المختبرية النقية فقط.

دمج الأنماط المفهومة والبُنى العميقة

في صميم النظام نهج هجين يستمع بطريقتين في آن واحد. يستخرج أحد الفروع أوصافًا صوتية كلاسيكية مفهومة لدى مهندسي الصوت والأطباء، مثل كيفية توزيع الطاقة عبر النغمات، ومعدل عبور الإشارة للصفر، وكيفية ارتفاع وهبوط طاقة الصوت عبر الزمن. تُعرف هذه المقاييس بتسليطها الضوء على الصفير والفرقعات. يُغذي الفرع الثاني نفس الصوت إلى YAMNet، وهو نموذج تعلم عميق مدمج دربته Google أصلاً على مجموعة هائلة من الأصوات اليومية. يحوّل YAMNet كل ثانية من التنفس إلى «بصمة» رقمية غنية تلتقط أنماطًا معقدة يصعب وصفها يدويًا. ثم يندمج هذان العرضان للصوت ويمرران المعلومات المدمجة عبر وحدات إضافية تركز على أنماط متعددة المقاييس وتؤكد تلقائيًا على القنوات الأكثر إفادة قبل أن يقوم مصنّف نهائي بالتشخيص.

Figure 2
الشكل 2.

اختبار الدقة وجعل الصندوق الأسود شفافًا

لاختبار مدى كفاءة نظامهم، استخدم المؤلفون استراتيجية اختبار دقيقة تُسمى التحقق المتقاطع المقسوم طبقيًا بخمس طيات، لضمان تمثيل كل حالة رئوية بعدل في مراحل التدريب والاختبار. وصل النموذج إلى نحو 98.6% دقة ونسبة F1 وقيمة المساحة تحت المنحنى مماثلة مرتفعة، متفوقًا بوضوح على عدة بدائل قوية، بما في ذلك نماذج التعلم الآلي التقليدية، وشبكات الالتفاف القياسية على صور الطيف، ونسخة أبسط تستخدم YAMNet وحده. والأهم من ذلك، لم يتوقف الفريق عند أرقام العناوين. استخدموا أدوات تصور لإظهار كيف تنتج الحالات المختلفة أشكال موجية وأنماط طيفية مميزة، واستعملوا SHAP، وهي طريقة مستعارة من نظرية الألعاب، لتسليط الضوء على الميزات والوحدات الخفية في الشبكة التي تؤثر بقوة على كل تنبؤ. كشفت هذه التحليلات أن النموذج يركز على دلائل ذات معنى سريري مثل نطاقات ترددية مرتفعة مستمرة وانفجارات مفاجئة تتوافق مع الصفير والفرقعات.

ماذا قد يعني هذا للرعاية اليومية

بعبارات بسيطة، تُظهر الدراسة أن نظام تعلم عميق مصمم بعناية يمكنه «الاستماع» للتنفس بدقة تقترب من الخبراء، حتى عندما تُسجَّل المقاطع بأجهزة عادية في بيئات صاخبة. من خلال مزج ميزات صوتية مفهومة مع تمثيلات متعلمة قوية، ومن خلال شرح قراراته عبر خرائط مرئية ودرجات أهمية الميزات، يقترب النظام من كونه مساعدًا رقميًا موثوقًا بدلًا من صندوق أسود غامض. وبينما لا يزال بحاجة إلى اختباره على مجموعات بيانات أكبر وأكثر، والتحقق من فعاليته في الممارسة السريرية، فإن هذا النهج يوجه إلى أدوات مستقبلية يمكن تشغيلها على الهواتف أو أجهزة خفيفة الوزن، لمساعدة الأطباء والمرضى على مراقبة الربو والأمراض الرئوية ذات الصلة بسرعة وبشكل غير تدخلّي وبتكلفة منخفضة.

الاستشهاد: Shatat, G.A.EL., Moustafa, H.ED., Saraya, M.S. et al. Hybrid deep learning and YAMNet features for asthma diagnosis from respiratory sounds. Sci Rep 16, 13781 (2026). https://doi.org/10.1038/s41598-026-49247-y

الكلمات المفتاحية: تشخيص الربو, الأصوات التنفسية, التعلم العميق, الصحة المتنقلة, تحليل الصوت الطبي