Clear Sky Science · ar

تجميع الانتباه حسب الفئة وندرة الرموز في محولات الرؤية لتفسير صور أشعة الصدر

2026-02-10 · العودة إلى الفهرس

أشعة أكثر ذكاءً لمرض رئوي عالمي

لا يزال السل واحدًا من أكثر الأمراض المعدية فتكًا في العالم، وغالبًا ما تكون أشعة الصدر هي الفحص التصويري الأول والوحيد المتاح في العيادات المزدحمة، خصوصًا في البلدان منخفضة ومتوسطة الدخل. ومع ذلك، فإن قراءة هذه الصور صعبة وتستغرق وقتًا طويلًا، حتى بالنسبة للخبراء. تعرض هذه الدراسة نظامًا للذكاء الاصطناعي مصممًا ليس فقط لاكتشاف علامات السل في أشعة الصدر بدقة عالية جدًا، بل أيضًا لإظهار الأطباء بالضبط أي أجزاء من الرئتين أثرت على قراره، بهدف بناء الثقة ودعم تشخيصات أسرع وأكثر اتساقًا.

لماذا قراءة صور الصدر صعبة جدًا

أشعة الصدر رخيصة وسريعة ومتاحة على نطاق واسع، مما يجعلها أداة جذابة للفحص الجماعي. المشكلة هي أن السل قد يظهر بطرق دقيقة يسهل تفويتها، خصوصًا عندما تكون الصور مضطربة أو منخفضة/مفرطة التعرض أو مأخوذة بمعدات قديمة. قد يختلف القارئون البشر فيما بينهم، ويمكن أن تغمر العيادات المزدحمة أطباء الأشعة. عالجت برامج الكمبيوتر التقليدية هذا بتقييم ميزات مصممة يدويًا في الصور وإدخالها إلى نماذج تعلم آلي قياسية، لكن هذه الأنظمة المبكرة كانت تعاني عندما جاءت الفحوصات من مستشفيات جديدة أو بإعدادات فنية مختلفة.

من الشبكات العصبية إلى رؤية مركزة على الانتباه

حسّن التعلم العميق، وخاصة الشبكات العصبية الالتفافية، النتائج من خلال تعلم الأنماط مباشرة من البكسلات، وحقق نتائج قوية على مجموعات بيانات السل. ومع ذلك، تركز هذه الشبكات بشكل أساسي على المناطق المحلية في الصورة وقد تفوت الأنماط الأوسع التي تمتد عبر كلا الرئتين. النماذج الأحدث المسماة محولات الرؤية تعامل الأشعة كشبكة من الرقع الصغيرة وتتعلم كيف يرتبط كل رقعة بكل أخرى، مما يلتقط البنية بعيدة المدى. وعلى الرغم من قوتها، فقد تلتفت المحولات الجاهزة إلى مناطق غير مهمة وقد تكون صعبة التفسير، مما يثير مخاوف حول ما إذا كانت قراراتها تتوافق مع المنطق السريري.

قناة ذكاء اصطناعي مصممة خصيصًا لصور الرئة

يصمم المؤلفون محول رؤية مخصصًا لمعالجة هذه نقاط الضعف في أشعة الصدر. أولًا، يتم معالجة كل صورة مسبقًا بعناية: تُعاد تحجيمها، وتُطبّع، وغالبًا ما تُمرر عبر تقنية تعزيز التباين التي تُبرز آفات الرئة الخفيفة مع تجنب الإفراط في الشحذ. تَستخرج مرحلة التلافيف الخفيفة في مقدمة النموذج تفاصيل دقيقة مثل الحواف والأنسجة الهامة في الصور الطبية. ثم تُقسّم الصورة إلى رقع صغيرة، تُحوّل كل واحدة إلى رمز قادر المحول على معالجته.

تعليم النموذج أين ينظر

لمساعدة النظام على تتبع التشريح، يستخدم النموذج آلية تشفير الموضع التي تضخ معلومات عن مكان وجود كل رقعة في الرئتين، بدلاً من معاملة جميع المواقع كقابلة للاستبدال. كما يقدم رموز "الفئة" الخاصة، واحد لكل فئة مرضية، تتعلم جمع الأدلة الأكثر صلة من جميع الرقع. تشجع استراتيجية الندرة الشبكة على الاعتماد على مجموعة فرعية فقط من أكثر الرموز معلوماتية، متخلّيةً عن أنماط الخلفية والضوضاء. تتضمن وصفة التدريب تقنيات مثل إسقاط الرموز العشوائي، وبرمجة معدّل التعلم بعناية، والحساب بدقة مختلطة، وكلها اختيرت لتحقيق استقرار التعلم على بيانات طبية محدودة وتجنب الإفراط في التكيّف مع خصائص صور التدريب.

رؤية ما تراه الذكاء الاصطناعي

الأهم من ذلك، بُني النظام ليشرح نفسه. بعد إصدار توقع بـ"السل" أو "طبيعي"، ينتج النموذج خرائط حرارية باستخدام طريقة تعرف باسم Grad‑CAM. تبرز هذه التراكبات الملونة مناطق الرئة التي أثرت أكثر في القرار. يصمم المؤلفون قناة الشرح لعرض أمثلة متوازنة من الحالات المريضة والسليمة، حتى يتمكن أطباء الأشعة من التحقق مما إذا كان الأداة تركز على هياكل ذات معنى سريري بدلاً من عيوب غير ذات صلة. على مجموعتي بيانات سل مفتوحتين، وصلت الطريقة إلى دقة تحقق تقارب 98 بالمئة ومنطقة تحت المنحنى قريبة من التمييز المثالي، مع أن المؤلفين يحذرون من أن تقسيم البيانات على مستوى الصورة قد يقدّر الأداء الحقيقي في العالم الخارجي قليلاً وأن الاختبار الخارجي ما زال ضروريًا.

ما يعنيه هذا للرعاية المستقبلية

بعبارات بسيطة، تُظهر هذه العمل نظام ذكاء اصطناعي يمكنه بسرعة ودقة الإشارة إلى حالات يُحتمل أن تكون سلًا على أشعة الصدر بينما يرسم أيضًا "خريطة" بصرية واضحة لمنطقه الاستدلالي. يمكن أن يساعد هذا النوع من الأدوات في فرز المرضى في العيادات محدودة الموارد، وتقليل الحالات المفقودة، وتوفير رأي ثانٍ متسق لأطباء الأشعة. في الوقت نفسه، يؤكد المؤلفون أن نموذجهم اختُبر فقط على مجموعتين عامتين من البيانات، ويركز على تسمية مرض واحدة، ويفتقر إلى التحقق السريري الكامل. تشمل الخطوات المستقبلية توسيع الطريقة لتشمل حالات رئوية متعددة، وتكييفها للصور ثلاثية الأبعاد مثل الأشعة المقطعية، والتحقق من شروحاتها مع أطباء الأشعة واختبارها عبر مستشفيات مختلفة. ومع ذلك، تمثل الدراسة خطوة واعدة نحو ذكاء اصطناعي لا يقتصر على الدقة فحسب، بل أيضًا على الشفافية والموثوقية في مكافحة السل.

الاستشهاد: Lokunde, V., Sundar, K., Khokhar, A. et al. Class-attention pooling and token sparsity based vision transformers for chest X-ray interpretation. Sci Rep 16, 8035 (2026). https://doi.org/10.1038/s41598-026-37109-6

الكلمات المفتاحية: السل, أشعة صدر, محول الرؤية, ذكاء اصطناعي مفسر, التصوير الطبي