Clear Sky Science · ar
خوارزمية تعرف صور للأجزاء عالية التكرار وذات تفاصيل دقيقة مبنية على بنية شبكة متعددة الفروع
عيون أذكى لقطع المصانع
تعتمد المصانع العصرية على الكاميرات والحواسيب لفرز آلاف القطع المعدنية المتشابهة تقريبًا بسرعة عالية. عندما تختلف تلك القطع في تفاصيل سطحية ضئيلة فقط، قد يختلط على برمجيات التعرف على الصور المتقدمة تمييزها، ما يؤدي إلى فرز خاطئ، وتأخيرات في الإنتاج، وتكاليف إضافية. تعرض هذه الدراسة طريقة جديدة لتمكين الآلات من «رؤية» هذه المكونات المتشابهة وتمييزها، مما يبشر بأتمتة تصنيع أكثر موثوقية ومرونة وكفاءة.
لماذا يصعب تمييز الأجزاء المتشابهة
في العديد من خطوط الإنتاج، يجب تصنيف ما يُسمى بالأجزاء عالية التكرار—قطع معدنية مسطحة مصنوعة بكميات كبيرة—إلى عشرات الفئات. التحدي أن القطع داخل الفئة نفسها قد تعرض نقوشًا سطحية معقدة، بينما قد تبدو قطع من فئات مختلفة متشابهة جدًا من الأعلى. تغيّر الإضاءة واختلاف وضعية القطعة أمام الكاميرا يزيدان المشكلة تعقيدًا. هذا النوع من المهام يندرج تحت ما يسميه علماء الحاسب التعرف دقيق التفاصيل: ليس مجرد تمييز سيارة عن شخص، بل تمييز قطعة تشبه أخرى جدًا بناءً على دلائل طفيفة.

نهجان للنظر إلى كل قطعة
يبني الباحثون على شبكة عصبية مدمجة تعرف باسم EfficientNet‑B0 ويحولوها إلى نظام متعدد الفروع يسمونه MBEN. بدلًا من إدخال صورة القطعة الكاملة فقط إلى الشبكة، يسمحون أولًا للنموذج بتحديد تقريبًا أي منطقة من الصورة تحمل أكثر المعلومات تمييزًا. وحدة كشف المنطقة ضعيفة الإشراف تنشئ خريطة حرارية تضيء المناطق المحتملة المهمة، ثم تقص رقعة صورة صغيرة حول تلك المنطقة. تسير الصورة الكاملة عبر فرع من الشبكة (الفرع العام)، بينما يسلك التكبير/الرقعة المقتطعة فرعًا آخر (الفرع المحلي). يتيح هذا التصميم للنظام تعلم المظهر العام والاختلافات المحلية الدقيقة التي تفرّق نوع قطعة عن أخرى.
تعليم النموذج ما هو المهم بالفعل
لا يكفي تقديم منظورين؛ بل يجب تعليم الشبكة التركيز على التمييزات الصحيحة. لتحقيق ذلك، يصمم المؤلفون وحدة تعزيز الخسارة—قواعد توجه كيفية تعديل الشبكة لنفسها أثناء التدريب. جزء من هذه الوحدة يدفع النظام إلى إيلاء اهتمام إضافي للفئات التي يجدها حاليًا مربكة، حتى لا يصبح واثقًا جدًا في الحالات السهلة ويتجاهل الصعبة. جزء آخر يشجع صور نفس نوع القطعة على الالتقاء بالقرب من بعضها في التمثيل الداخلي للشبكة، بينما يدفع الأنواع المختلفة أبعد عن بعضها. معًا، تشكل هذه الآليات خريطة داخلية أوضح لفئات القطع، مما يزيد احتمال تصنيف الصور الجديدة وغير المرئية بشكل صحيح.

مزج الصورة العامة مع التكبير
بعد أن ينتج كل من الفرعين العام والمحلي توقعاته الخاصة، تجمع وحدة دمج الفروع هذه التنبؤات إلى قرار نهائي. يضبط الباحثون مقدار مساهمة كل فرع، ويجدون أن إعطاء وزن أكبر قليلاً للصورة العامة مع الاعتماد القوي أيضًا على الرقعة المقرَّبة يعطي أفضل النتائج. يختبرون طريقتهم على مجموعة بيانات مخصصة تضم 20 نوعًا من الأجزاء عالية التكرار مُصوَّرة تحت إضاءة مصنع واقعية، مع آلاف الصور الموسعة بتقنيات زيادة البيانات مثل الدوران والقص العشوائي. يحقق نظام MBEN دقة تصل إلى 98.75%—أفضل بعدة نقاط مئوية من مجموعة من أساليب التعرف دقيق التفاصيل القائمة—مع استخدام موارد حوسبة متواضعة نسبيًا.
ما يعنيه هذا للإنتاج في العالم الحقيقي
تُظهر الدراسة أن الجمع بين سياق الصورة الكامل، والرقع المفصَّلة المُكتشفة تلقائيًا، وقواعد تدريب مصممة بعناية يمكن أن يجعل رؤية الآلة أكثر موثوقية للمهام الصناعية الصعبة. بالنسبة للمصنّعين، قد تترجم مثل هذه التحسينات إلى أخطاء فرز أقل، وفحص يدوي أقل، ومرونة أكبر عند التبديل بين أنواع عديدة متشابهة من المنتجات. على الرغم من أن العمل لم يتناول بعد بيانات العالم الحقيقي غير المتوازنة، حيث تكون بعض أنواع القطع نادرة جدًا مقارنة بغيرها، تشير النتائج إلى أن «عيون» رقمية أكثر ذكاءً وانتقائية يمكنها مواكبة خطوط إنتاج أكثر دقة وتنوعًا.
الاستشهاد: Deng, J., Sun, C., Lin, J. et al. An image recognition agorithm for fine-grained high-frequency workpieces based on a multi-branch network architecture. Sci Rep 16, 11067 (2026). https://doi.org/10.1038/s41598-026-41639-4
الكلمات المفتاحية: التعرف على الصور الصناعية, التصنيف دقيق التفاصيل, مراقبة الجودة الآلية, الرؤية الحاسوبية في التصنيع, الشبكات العصبية