Clear Sky Science · ar

CR-MSNet: شبكة انتباه متعددة المقاييس ذات فرعين لتصنيف الأشعة السينية الصدرية متعددة التصنيفات

· العودة إلى الفهرس

لماذا تعتبر أشعة الصدر الأذكى مهمة

تُعد أشعة الصدر واحدة من أكثر الفحوصات الطبية شيوعًا في العالم، وتُستخدم للبحث عن مجموعة واسعة من مشكلات الرئة والقلب في لقطة واحدة فقط. ومع ذلك، فإن قراءة هذه الصور عمل شاق حتى للأشعة ذوي الخبرة، وقد تخفي صورة واحدة عدة أمراض مختلفة في نفس الوقت. تقدم هذه الدراسة نموذج ذكاء اصطناعي جديدًا، يُدعى CR-MSNet، صُمم لقراءة أشعة الصدر بطريقة أقرب إلى الخبير: حيث ينتبه لكل من الصورة الكلية للصدر والأشكال الدقيقة والصعبة الاكتشاف، وفي الوقت نفسه يتعامل مع الأمراض النادرة التي تظهر لدى عدد قليل فقط من المرضى.

رؤية الصدر ككل ونقاط المشاكل الدقيقة

معظم الأدوات الحاسوبية الحالية تنظر إلى أشعة الصدر عبر مسار معالجة واحد، مما يصعّب التقاط كل من أشكال الأعضاء الواسعة والآفات الصغيرة جدًا داخل نفس النموذج. بدلًا من ذلك، يستخدم CR-MSNet مسارين موازيين. يركز المسار «العام» على البنية العامة للرئتين والقلب، متعلمًا الأنماط بعيدة المدى التي تمتد عبر الصورة بأكملها. أما المسار «المحلي» فيقرب الانتباه إلى مناطق أصغر لالتقاط التفاصيل الدقيقة، مثل العقد الصغيرة أو الثخانة الطفيفة على جدار الصدر. من خلال تشغيل هذين المسارين جنبًا إلى جنب، يمكن للنظام التعرف على الأمراض التي تظهر كظلال واسعة متناثرة وكذلك تلك التي تظهر كبقع صغيرة وحادة.

Figure 1
Figure 1.

تعليم النموذج أين ينظر

وجود مسارين وحده لا يكفي؛ يحتاج النظام أيضًا إلى أن يقرر أي أجزاء الصورة تستحق أكبر قدر من الانتباه. يقدم CR-MSNet وحدة انتباه جديدة تعمل بطريقتين في الوقت نفسه. أولًا، توازن بين «قنوات» الميزات المختلفة، التي يمكن اعتبارها طرقًا مختلفة لوصف الصورة (مثل الحواف والأنسجة وأنماط السطوع)، وتعزز القنوات الأكثر فائدة في الكشف عن المرض. ثانيًا، تُبرز المناطق المهمة في الفضاء، مَعزِّزةً الإشارات في مناطق الآفات المحتملة ومخففةً من تأثير البُنى المشتتة مثل الأضلاع أو ظل القلب. يتم دمج هذين النوعين من التركيز بطريقة مرنة تحافظ على بنية الصورة الأصلية، مما يساعد النموذج على التقاط أنماط ذات معنى عبر أحجام آفات متعددة.

مزج السياق العام مع التفاصيل المحلية

بعد أن يحسّن كل فرع رؤيته لأشعة الصدر، يجمع CR-MSNet بينهما باستخدام آلية انتباه متقاطع. ببساطة، يسأل الفرع العام: «بالنظر إلى فهمي للبنية الكلية للصدر، أي التفاصيل المحلية هي الأكثر أهمية؟» وفي الوقت نفسه، يقدم الفرع المحلي أنماطه الدقيقة الأكثر معلوماتية. تتيح خطوة الانتباه المتقاطع لهذين المنظورين أن يؤثرا على بعضهما البعض، منتجة تمثيلًا مدمجًا يحفظ التخطيط العام للرئتين والقلب مع إثرائه بإشارات موضعية دقيقة. ثم يقرر مكوّن بوابات تكيفي، صورة تلو الأخرى، مقدار الثقة في العرض المدمج مقابل العرض العام فقط، مما يساعد على الحفاظ على الاستقرار عندما تكون الدلائل المحلية ضعيفة أو مشوشة.

Figure 2
Figure 2.

التعامل بعدل مع الأمراض الشائعة والنادرة

تُظهر مجموعات أشعة الصدر الواقعية تمايزًا كبيرًا: بعض المشاكل، مثل ضبابية عامة في الرئة، شائعة، في حين أن حالات أخرى، مثل الفتوق المرئية بالأشعة، نادرة. تميل طرق التدريب القياسية إلى تفضيل الحالات الشائعة وقد تتجاهل النادرة. لمواجهة ذلك، يدرب المؤلفون CR-MSNet على مرحلتين. أولاً، يؤجلون مؤقتًا الصور التي لا تظهر أي مرض حتى يتمكن النموذج من التركيز على تعلم شكل الاختلالات المختلفة. في المرحلة الثانية، يعيدون إدخال مجموعة البيانات الكاملة لكنهم يستخدمون دالة خسارة معدّلة تمنح وزنًا إضافيًا للأمراض النادرة والحالات التي يصعب تصنيفها. تساعد هذه الطريقة المرحلية النظام على البقاء حساسًا للنتائج غير المألوفة من دون أن يضحي بالدقة العامة.

مدى أداء النظام الجديد

اختبر الباحثون CR-MSNet على ChestX-ray14، وهو مجموعة بيانات عامة كبيرة تحتوي على أكثر من 100,000 صورة أشعة صدر معنونة لأربعة عشر مرضًا مختلفًا. تحت ظروف تدريب وتقييم متطابقة، تفوق نموذجهم على مجموعة من أساليب التعلم العميق الرائدة، بما في ذلك الشبكات التلافيفية التقليدية، ونماذج المحولات الحديثة، وغيرهما من الهجائن التي تمزج بينهما. في المتوسط، حقق CR-MSNet منطقة تحت منحنى ROC (AUC) أعلى من جميع المرجعيات وقدم مكاسب ملحوظة بشكل خاص للحالات الأصغر أو الأقل شيوعًا مثل الفتق وبعض الكتل. كما أظهر النموذج متانة معقولة عند تقييمه، من دون إعادة تدريب، على مجموعة بيانات مختلفة تُدعى CheXpert، مما يشير إلى قدرته على التكيف مع تغيّر تجمعات المرضى وأساليب التصوير.

ماذا يعني هذا لقراءة أشعة الصدر مستقبلًا

بمعنى عملي، يمثل CR-MSNet خطوة نحو مساعد ذكاء اصطناعي يمكنه مسح صورة أشعة صدر لعدة أمراض في وقت واحد، والانتباه لكل من المشكلات الكبيرة والصغيرة، وإيلاء الاهتمام المناسب للحالات النادرة لكنها المهمة. من خلال دمج المنظورين العام والمحلي مع آليات تركيز ذكية وخطة تدريب مدروسة، يقلل النموذج بعض النقاط العمياء التي كانت تعيق الأنظمة السابقة. وبينما لا يحل محل أخصائيي الأشعة—ولا يزال يواجه صعوبات مع بعض الأنماط الغامضة جدًا مثل الالتهاب الرئوي—فهو يقدم نقطة انطلاق أكثر موثوقية للفرز الآلي ودعم اتخاذ القرار، مما قد يسرّع التشخيص ويساعد الأطباء على التعامل مع أحجام كبيرة من الدراسات التصويرية بثقة أكبر.

الاستشهاد: Wang, Y., Bao, C., Wang, Z. et al. CR-MSNet: a dual-branch multi-scale attention network for multi-label chest X-ray classification. Sci Rep 16, 14585 (2026). https://doi.org/10.1038/s41598-026-44591-5

الكلمات المفتاحية: الذكاء الاصطناعي لأشعة الصدر, التشخيص متعدد التصنيفات, التعلّم العميق في الأشعة, الانتباه في الصور الطبية, بيانات طبية غير متوازنة