Clear Sky Science · ar
إطار اكتشاف متعدد المقاييس وخفيف للصور بالأشعة السينية مع تعلم تبايني مُشرف
لماذا تهم فحوصات الأشعة السينية الأذكى
من مرّ بخط التفتيش في المطارات يعلم أن كل حقيبة يجب أن تُفحص بسرعة ودقة. ومع ذلك، لا تُعد صور الأشعة السينية بسيطة: السكاكين والزجاجات وأجهزة الحاسب المحمولة والشواحن تتكدس فوق بعضها البعض، ويمكن للعناصر الخطرة أن تختبئ بسهولة ضمن الفوضى. تقدم هذه الورقة طريقة جديدة في الذكاء الاصطناعي تساعد أجهزة الأشعة السينية على اكتشاف التهديدات الصغيرة أو المتداخلة بمزيد من الثقة، مع الحفاظ على سرعة تشغيل كافية لنقاط التفتيش المزدحمة.

تحدي الرؤية من خلال الفوضى
تُعد أنظمة أمن الأشعة السينية خط الدفاع الأول في المطارات ومحطات المترو وغيرها من الأماكن العامة المزدحمة. التفتيش البشري التقليدي بطئ ومرهق، مما يزيد من خطر مرور عناصر غير مكتشفة. حسّن كل من كاشفات الذكاء الاصطناعي الحديثة من عائلة YOLO عمليات الفحص الآلي، لكنها صُممت في الأصل للصور اليومية، لا للمناظر الشبحية منخفضة التباين للأشعة السينية. في هذه المسوحات، تتداخل الأجسام غالبًا وتظهر شبه شفافة وتتنوع أحجامها على نحو كبير. يمكن أن تُطمر شفرات صغيرة أو زجاجات بين عناصر غير ضارة، والعديد من الخوارزميات الحالية إما تفشل في اكتشافها أو تتطلب قدرة حسابية كبيرة يصعب نشرها على أجهزة مدمجة منخفضة التكلفة.
عقل أخف لأجهزة الأشعة السينية
يبني المؤلفون عملهم على كاشف YOLOv8 الشائع ويعيدون تصميمه خصيصًا لصورة الأشعة السينية. تتمثل خطوتهم الأولى في تخفيف الشبكة باستخدام عمليات الالتفاف «القابلة للفصل حسب العمق» — وهو وصف تقني يعني أن النموذج ينظر إلى الأنماط بطريقة أكثر اقتصادًا. بدلاً من تطبيق مرشحات كبيرة ومكلفة على كل قناة من قنوات الصورة دفعة واحدة، يفصل العملية إلى خطوات أرخص. يقلل هذا التغيير عدد الحسابات بنحو ربع إلى ثلثيها تقريبًا، مع الحفاظ على التفاصيل الدقيقة اللازمة لاكتشاف العناصر الصغيرة والجزء المختبئ منها. الناتج هو "عقل" رقمي أخف يمكنه العمل في الزمن الحقيقي على أجهزة متواضعة، مثل المعالجات المدمجة داخل أجهزة الفحص.
مساعدة النموذج على التركيز على المهم
ليس كافيًا جعل الشبكة أصغر؛ يجب أيضًا أن تصبح أكثر انتقائية. لهذا الغرض، يقدم الباحثون وحدة دمج الانتباه القنوي-المكاني (CSAF). يتعلم فرع واحد من هذه الوحدة أنواع الميزات البصرية — الحواف أو الأشكال أو دلائل المواد — الأكثر إفادة بشكل عام، بينما يتعلم فرع آخر أين يحدث الفعل في الصورة. بدلًا من تطبيق هذه الانتباهات بالتتابع، يعالجها CSAF بالتوازي ثم يدمجها، بحيث يمكن للنظام أن يأخذ في الاعتبار كلاً من «ما هو» و«أين» في الوقت نفسه. تُشبك وحدات الانتباه هذه في تصميم متعدد المقاييس يجمع بين رؤى خشنة ودقيقة للمشهد، وهو ما يكون مفيدًا بشكل خاص لاكتشاف العناصر الصغيرة والمتداخلة في الحقائب المكتظة.

تعليم النظام على تمييز الشبه
تكمن صعوبة أخرى في مسوحات الأشعة السينية في أن العديد من العناصر تبدو متشابهة: علبة وصفاية رذاذ أو أنواع مختلفة من السكاكين قد تشترك في محيطٍ متقارب. لجعل النموذج أفضل في التمييز بين هذه الفئات، يضيف المؤلفون هدف تعلم تبايني. أثناء التدريب، يُشجَع الشبكة على تقريب أمثلة الفئة نفسها في تمثيلها الداخلي، بينما تدفع أمثلة الفئات المختلفة بعيدًا عن بعضها. وفي الوقت نفسه، تساعد مقياس التداخل على مستوى البكسل المسمى PIoU على ضبط موضع وشكل المربعات المحيطة المتوقعة، وهو أمر حيوي عندما تكون الأجسام مائلة أو مزدحمة أو مرئية جزئيًا. تعلم هذه الخسائر مجتمعة النموذج ليس فقط مكان وجود الجسم، بل ما يميزه عن الجيران المشتتين.
إثبات الأداء في اختبارات واقعية
يقيم الفريق منهجهم على مجموعتي بيانات تحدٍّ للأشعة السينية تتضمّنان نقاط تفتيش حقيقية ومشاهد أمتعة مُنشأة اصطناعيًا تحوي فئات تهديد متعددة. بالمقارنة مع مرجعية YOLOv8 القياسية، يصل نموذجهم إلى دقة أعلى على مقاييس التداخل الصارمة مع استخدام عدد أقل من المعاملات وحساب أقل. يحافظ على معدلات كشف عالية جدًا للأجسام الحادة ويُحسّن التعرف على العناصر الشفافة أو القابلة للتشوه مثل الزجاجات وعلب المشروبات. تُظهر منحنيات الدقة–الثقة والاستدعاء–الثقة أن توقعاته تظل مستقرة حتى عند رفع عتبة إعلان الكشف، ما يعني إنذارات مزيفة أقل وتهديدات مفقودة أقل. تؤكد الاختبارات على مجموعة بيانات ثانية جمعت في مكان آخر أن النظام يعمم جيدًا، وهو مطلب مهم للنشر في العالم الحقيقي حيث تختلف محتويات الحقائب وظروف التصوير.
ماذا يعني هذا للمسافرين في حياتهم اليومية
بالنسبة للقارئ العادي، الخلاصة أن هذا العمل يقدم طريقة أكثر ذكاءً وخفة لمسح الأمتعة. من خلال إعادة تصميم كاشف ذكاء اصطناعي حديث ليكون خفيفًا وأكثر تمييزًا، يمكّن المؤلفون أجهزة الأشعة السينية من العمل بسرعة على عتادٍ ميسور التكلفة مع الاستمرار في التقاط التهديدات الصغيرة أو المتداخلة أو المشابهة للمظهر. إذا ما اُتبِذت مثل هذه الطرق عمليًا، فقد تُساعد في تقصير الطوابير وتقليل عمليات الفحص غير الضرورية، والأهم من ذلك — تحسين فرص اكتشاف العناصر الخطرة حقًا قبل أن تصل إلى البوابة.
الاستشهاد: Diao, Q., Chan, W., Zain, A.M. et al. A lightweight multi-scale detection framework for X-ray images with supervised contrastive learning. Sci Rep 16, 8635 (2026). https://doi.org/10.1038/s41598-026-38000-0
الكلمات المفتاحية: فحص بالأشعة السينية للأمن, كشف الأجسام, التعلم العميق, فحص المطارات, رؤية الحاسوب