Clear Sky Science · ar

استراتيجية تعزيزية قائمة على تقليد الميزات مع الانتباه للكشف البصري عن الشوائب

· العودة إلى الفهرس

لماذا يهم اكتشاف الأنماط الغريبة في الصور

من الحفاظ على خلو منتجات المصانع من العيوب الصغيرة إلى مراقبة الأحداث غير العادية في شوارع المدن، يُطلب من الحواسيب بشكل متزايد الإشارة إلى أي شيء يبدو خارجًا عن المألوف. تقدّم هذه الورقة طريقة جديدة لمساعدة الذكاء الاصطناعي على تمييز المشاهد الطبيعية عن المشبوهة بمزيد من الموثوقية، حتى عندما لم يرَ النظام إلا أمثلة طبيعية أثناء التدريب.

Figure 1. كيف تعمل شبكات المعلم-التلميذ وآلية الانتباه معًا لاكتشاف الأحداث الغريبة والعيوب في الصور والفيديو.
Figure 1. كيف تعمل شبكات المعلم-التلميذ وآلية الانتباه معًا لاكتشاف الأحداث الغريبة والعيوب في الصور والفيديو.

تعليم الحاسوب كيف تبدو الحالة الطبيعية

في العديد من البيئات الواقعية، تكون الشوائب الحقيقية نادرة ومن الصعب وسمها يدويًا. نتيجة لذلك، تتعلم معظم الأنظمة من الصور والفيديوهات الطبيعية فقط، ثم تحاول رصد أي شيء لا يتوافق مع ما شاهدته سابقًا. نهج شائع هو تدريب نموذج لإعادة بناء، أو "استعادة"، صور الإدخال ثم اعتبار الأخطاء الكبيرة في إعادة البناء كتحذيرات. لكن النماذج الحديثة قوية إلى درجة أنها أحيانًا تعيد بناء المشاهد الشاذة جيدًا للغاية، مما يؤدي إلى أخطاء خطيرة حيث تُمرر المنتجات المعيبة أو الأحداث الغريبة كأمور عادية.

التعلم من مرشد أقوى

يتعامل المؤلفون مع هذه المشكلة بإقران نموذجين، يُسمّيان المعلم والتلميذ. المعلم هو شبكة مُدَرَّبة مسبقًا تعرف بالفعل كيفية أداء مهمة إعادة البناء على البيانات الطبيعية. بدلًا من مطالبة التلميذ فقط بإعادة بناء الصور، تطالب الطريقة الجديدة أيضًا أن يُقلّد ميزات المعلم الداخلية. تلتقط هذه الميزات المخفية المعنى العام والبنية للمشاهد الطبيعية. عندما تُعرض صورة شاذة، يجد التلميذ، المدرب فقط على البيانات الطبيعية، صعوبة في تقليد ردود فعل المعلم الداخلية. يصبح هذا التباين دليلًا إضافيًا قويًا على أن ثمة خطأ ما، يتجاوز مجرد الفروقات على مستوى البكسل.

جعل الانتباه يتبع التباين

لاستخلاص أقصى استفادة من اختلاف المعلم والتلميذ، تضيف الورقة وحدة انتباه خاصة موجهة بواسطة تناقض الميزات. تبدأ بحساب "خريطة الفروقات" بين الميزات التي يولدها المعلم والتلميذ. تميل هذه الخريطة لأن تكون صغيرة وناعمة للمدخلات الطبيعية، لكنها تتوهّج حول المناطق الشاذة فعلًا. ثم تستخدم وحدة الانتباه هذه الخريطة لتقوية أو إضعاف أجزاء من ميزات التلميذ، دفعةً النظام للتركيز على المناطق التي يكون فيها التباين أعلى. على عكس الانتباه التقليدي الذي عادةً يبرز المناطق اللافتة بصريًا، فإن هذا الانتباه مدفوع فقط بعدم التناسق الدلالي بين المعلم والتلميذ، مما يجعله مرتبطًا بالشوائب بشكل أوثق.

Figure 2. كيف توجه الفروقات بين ميزات المعلم والتلميذ الانتباه لتسليط الضوء على المناطق غير الطبيعية بالفعل.
Figure 2. كيف توجه الفروقات بين ميزات المعلم والتلميذ الانتباه لتسليط الضوء على المناطق غير الطبيعية بالفعل.

إثبات الفكرة على الفيديوهات وصور المصانع

يقحم الباحثون مخطط تقليد الميزات والانتباه في عدة أنظمة رائدة لكشف الشوائب لكل من فيديوهات المراقبة وصور المنتجات الصناعية. يختبرون الطرق المجمعة على ثلاث مجموعات معيارية صعبة: Avenue وShanghaiTech للأحداث غير العادية في مشاهد الحرم، وMVTec AD للعيوب الدقيقة في الأشياء والأنسجة مثل السجاجيد، وقطع المعادن، وفرش الأسنان. عبر هذه الاختبارات، تتفوق الأنظمة المحسنة باستمرار على نسخها الأصلية، باكتشاف المزيد من الشوائب مع الحفاظ على معدل إنذارات كاذبة منخفض. في بعض الفئات، تتحسن دقة تحديد مناطق العيب بأكثر من عشرين نقطة مئوية، مما يُظهر أن الإرشاد الإضافي من تناقض الميزات والانتباه يصقل عين النموذج بشكل كبير.

ما الذي يعنيه ذلك للمراقبة التلقائية الموثوقة

بالنسبة للقارئ العام، الرسالة الأساسية هي أن هذا العمل يمنح الحواسيب إحساسًا أفضل بما "لا ينتمي" فعلًا إلى الصورة أو الفيديو. من خلال مطالبة نموذج التلميذ ليس فقط بنسخ ما يرى، بل أيضًا بتقليد كيفية تفكير المعلم الموثوق داخليًا، ثم توجيه الانتباه نحو المناطق التي تختلف فيها ردودهما، تقلّل الطريقة من خطر مرور الأحداث غير العادية أو العيوب دون أن تُكتشف. هذا يجعل خطوط التفتيش الآلية وأنظمة المراقبة أكثر اعتمادية دون الحاجة إلى مجموعات كبيرة من الأمثلة الشاذة الموسومة.

الاستشهاد: Zheng, B., Gan, Y., Wang, L. et al. A boosting strategy based on feature mimicking with attention for visual anomaly detection. Sci Rep 16, 15084 (2026). https://doi.org/10.1038/s41598-026-37667-9

الكلمات المفتاحية: كشف الشوائب البصرية, شبكة المعلم-التلميذ, آلية الانتباه, تفتيش صناعي, مراقبة الفيديو