Clear Sky Science · ar
إطار تعلم متعدد الوسائط غير متأثر بالجهاز لتصنيف أمراض الجهاز التنفسي
لماذا قد يساعد هاتفك في يوم من الأيام على فحص رئتيك
يحمل معظمنا ميكروفوناً وجهاز حاسوب قويين في الجيب طوال اليوم. ماذا لو كان بإمكان ذلك الجهاز العادي أن يستمع لفترة قصيرة من السعال وينبه إلى علامات مبكرة لأمراض رئوية خطيرة، حتى عندما لا يتوفر طبيب أو معدات مكلفة؟ تستكشف هذه الدراسة كيفية تحويل السعال العادي، مع بعض المعلومات الخلفية عن الشخص، إلى تحذيرات موثوقة لعدة مشاكل تنفسية شائعة، باستخدام ذكاء اصطناعي يعمل عبر هواتف ذكية وأجهزة تسجيل مختلفة.
الاستماع إلى المرض في سعال بسيط
تبدأ العديد من حالات الرئة — من الانسداد الرئوي المزمن والربو إلى العدوى — بشكاوى غامضة مثل السعال والبلغم وضيق التنفس. اليوم، غالباً ما يتطلب تأكيد هذه الأمراض تصوير الصدر أو اختبارات وظائف الرئة أو فحوصات مفصلة من أخصائيين، وكلها قد تكون غير متاحة بسهولة في العيادات المزدحمة أو الأماكن ذات الموارد المحدودة. نشأت أدوات تحليل السعال المدعومة بالذكاء الاصطناعي كبديل منخفض التكلفة وغير جائر، لكن معظمها حتى الآن اعتمد على نوع واحد من أجهزة التسجيل وفحص الصوت بمفرده. سعى الباحثون لتصميم نظام أذكى يمكنه استخدام صوت السعال مع إجابات استبيان بسيطة وتفاصيل ديموغرافية، ويظل دقيقاً حتى عندما يسجل الناس أنفسهم عبر هواتف وميكروفونات متعددة في المنازل أو العيادات المزدحمة.

بناء فحص رقمي قوي من آلاف المرضى
جمعت الفريق مجموعة بيانات واقعية كبيرة من أكثر من 12,000 مراجع بالغ في أربع مستشفيات. لكل مشارك جمعوا ما لا يقل عن عشر ثوان من السعال الطوعي في غرفة هادئة ومرروا كل تسجيل عبر خط صارم لمراقبة الجودة لإزالة الضوضاء الخلفية والكلام والسعات غير الصالحة. حُوّل كل مقطع سعال معتمد إلى تمثيل صوتي شبيه بالصورة وأُدخل إلى نموذج صوتي تدرب سابقاً على مجموعات صوتية هائلة. وفي الوقت نفسه، رمز الباحثون معلومات خلفية بسيطة — مثل العمر والجنس والطول والوزن وتاريخ التدخين وأعراض رئيسية كالبلغم أو ضيق التنفس — عبر نموذج لغوي مهيأ للنصوص الطبية. ثم تعلّم شبكة دمج كيف تجمع هذين المسارين لتقرر أي من سبع أمراض تنفسية من المرجح وجودها لدى كل شخص.
تعليم الذكاء الاصطناعي تجاهل الجهاز والتركيز على المرض
عقبة رئيسية للاستخدام في العالم الحقيقي هي أن السعالات تُسجَّل على أنواع عديدة من الهواتف والميكروفونات، وكل واحدة تُلوّن الصوت بشكل مختلف. للتغلب على هذا «تأثير الجهاز» أضاف المؤلفون فرع تدريب خاص يحاول تحديد أي جهاز أنتج كل سعال. وفي الوقت نفسه، يُكافأ النموذج الرئيسي على تقديم تنبؤات مرضية جيدة ويُعاقب كلما سهلت ميزاته الداخلية التعرف على الجهاز. هذا الإعداد العدائي يدفع النظام لإزالة السمات الخاصة بالجهاز والاحتفاظ فقط بالنماذج المتعلقة بالمرض. حيلة تدريبية إضافية تشجع النموذج على التصرف باستقرار عبر الأجهزة، مما يعزز الأداء عندما يواجه أجهزة جديدة لم يرها من قبل.
مدى قدرة النظام على اكتشاف مشاكل الرئة المختلفة
باستخدام هذا التصميم، بلغ النموذج دقة عالية جداً في ثلاث مهام فرز مهمة. بالنسبة للانسداد الرئوي المزمن، الذي غالباً ما لا يُشخَّص حتى مراحل متأخرة، حقق النظام قيمة مساحة تحت المنحنى تقارب 0.97، مما يشير إلى فصل ممتاز بين المرضى والأصحاء. أدّى بشكل قوي، وإن بدرجة أقل بعض الشيء، في حالات عدوى المسالك التنفسية السفلية وما يُسمى بالظلال الرئوية — بقع على الصور قد تمثل أوراماً أو تغيرات تركيبية. عند طلب تقييم جميع الحالات التنفسية السبع معاً، بما في ذلك تداخل الأمراض في المريض نفسه، تجاوزت الأداة عدة بدائل متطورة. أظهرت المقارنات الدقيقة أن صوت السعال حمل الإشارة الأقوى، بينما أضافت المعلومات الديموغرافية وإجابات الأعراض سياقاً مفيداً. حسّن التدريب العدائي النتائج باستمرار وقلل، مما هو حاسم، من الانخفاض في الدقة عند اختبار النظام على سعات مسجلة باستخدام نماذج هواتف جديدة كلياً.

من تجربة مستشفوية إلى رفيق صحة يومي
بينما لا يزال النموذج غير جاهز ليحل محل تصوير الصدر أو تقييم الأخصائي — خاصة لحالات نادرة أو صامتة مثل العقيدات الرئوية الصغيرة — فإنه يظهر وعداً حقيقياً كمساعد في فرز الحالات. في الممارسة العملية، قد يعني ذلك جلسة سعال قصيرة في الهاتف، تليها نتيجة مخاطر سريعة تساعد في اتخاذ قرار حول من يحتاج إلى فحوصات أو متابعة إضافية. يشير المؤلفون إلى تحديات قائمة، بما في ذلك عدم توازن البيانات للأمراض النادرة، وتنقص التنوع العرقي، والحاجة إلى التعامل مع بيئات منزلية صاخبة. ومع ذلك، تُظهر نتائجهم أنه بتصميم دقيق يمكن لنظام ذكاء اصطناعي أن يستمع متجاوزاً خصائص الأجهزة المختلفة، ويجسد بيانات استبيان بسيطة مع أصوات السعال، ويقدم دعماً قابلاً للتوسع ومنخفض التكلفة للكشف المبكر ومراقبة أمراض الجهاز التنفسي.
الاستشهاد: Yang, M., Liu, X., Du, W. et al. A device-invariant multi-modal learning framework for respiratory disease classification. npj Digit. Med. 9, 290 (2026). https://doi.org/10.1038/s41746-026-02445-4
الكلمات المفتاحية: تحليل السعال, كشف أمراض الجهاز التنفسي, الصحة المتنقلة, التعلّم العميق متعدد الوسائط, ذكاء اصطناعي غير متأثر بالجهاز