Clear Sky Science · ar

LogoXpertNet: تصنيف شعارات خفيف الوزن مبتكر باستخدام التعلم العميق

· العودة إلى الفهرس

لماذا يهم رصد الشعارات

يومياً، تتدفق مليارات الصور ومقاطع الفيديو عبر وسائل التواصل الاجتماعي ومواقع التسوق وخلاصات الأخبار، ويظهر في كثير منها شعارات علامات تجارية على القمصان والشاحنات والواجهات والمنتجات. يساعد التعرف التلقائي على هذه الشعارات في مهام مثل تتبع ظهور العلامة التجارية، ومكافحة السلع المقلدة، والتحقيق في الأدلة الرقمية. لكن تعليم الحواسيب لالتقاط شعارات صغيرة وغالباً مشوهة في مشاهد العالم الحقيقي المزدحمة أمر أصعب مما يبدو. تقدم هذه الورقة LogoXpertNet، نظام ذكاء اصطناعي مدمج مصمم للتعرف على الشعارات بدقة مع كونه سريعاً وكفؤاً بما يكفي للعمل على الأجهزة اليومية.

تحدي الرموز الصغيرة في عالم فوضوي

الشعارات ليست مثل الأشياء اليومية مثل السيارات أو الكراسي. قد تظهر العلامة نفسها بأشكال كثيرة: مطبوعة على القماش، مصورة بزوايا غريبة، ممتدة على اللوحات الإعلانية، أو مخفية جزئياً خلف أشياء أخرى. وفي المقابل، قد تبدو علامات تجارية مختلفة متشابهة بدرجة تُربك النظام، إذ تشترك في ألوان أو أشكال أو أنماط زخرفية مماثلة. تعاني طرق رؤية الحاسوب التقليدية من هذا المزيج من صغر الحجم والتشوه والخلفيات المزدحمة والتشابه البصري. وحتى الأنظمة الحديثة المعتمدة على التعلم العميق، رغم قوتها، غالباً ما تكون ثقيلة جداً لتعمل في الوقت الحقيقي على الهواتف والكاميرات أو الأجهزة ذات قدرة الحوسبة المحدودة.

شبكة مدمجة مع تركيز انتقائي

تتصدى LogoXpertNet لهذه المشكلات بالانطلاق من عائلة شبكات عصبية خفيفة طورت في الأصل للهواتف المحمولة، ثم بإضافة مجموعة من الوحدات المصممة خصيصاً للغرض. تقوم الشبكة الأساسية بمسح الصورة بسرعة وبناء خرائط ميزات متعددة الطبقات تلتقط الحواف والأنسجة والأشكال على مقاييس مختلفة. فوق ذلك، تدمج وحدة دمج الميزات عبر الطبقات معلومات من الطبقات السطحية (التي تحافظ على التفاصيل الدقيقة) مع الطبقات العميقة (التي تلتقط البنية الأوسع). يساعد هذا النظام على تتبع الخطوط الدقيقة والحدود الحادة التي غالباً ما تميّز شعاراً عن آخر مع الحفاظ على فهم المشهد الكلي.

Figure 1
الشكل 1.

تعليم النموذج أين ينظر

لتوضيح رؤيته أكثر، يستخدم LogoXpertNet كتل انتباه خاصة تعمل قليلاً مثل ضوء مركّز في مسرح. تفحص وحدة تسمى الكتلة المكانية الهرمية من نوع squeeze-and-excitation عبر مقاييس متعددة في وقت واحد. تستعرض أنماطاً عالمية عبر الصورة كاملة، والأقوى إشارات محلياً، والمناطق الأصغر ثم تعزز القنوات والمناطق الأكثر معلوماتية بينما تُخفت الباقي. تضيف وحدة ثانية، كتلة الانتباه الواعية بالميزات، بعداً آخر: فهي تحلل أيضاً المحتوى الترددي للصورة، مما يبرز الحواف الحادة والأنماط المتكررة والأنسجة الدقيقة الشائعة في تصميمات الشعارات. بدمج المؤشرات المكانية مع مؤشرات معتمدة على التردد، يصبح النظام أفضل في استخلاص إشارة شعار واضحة من خلفياتٍ معقدة ومليئة بالضجيج.

اختبار النظام

قيّم الباحثون LogoXpertNet على ثلاث مجموعات شعارات معروفة تحاكي ظروف العالم الحقيقي: مجموعة صغيرة لكن متنوعة من 32 علامة تجارية من صور عفوية، ومجموعة صور إخبارية إقليمية لشعارات بلجيكية، ومجموعة على مقياس ويب كبيرة جداً تحتوي على ملايين الصور وتسميات طبيعية الضجيج. عبر الثلاث مجموعات، حقق النظام الجديد درجات قريبة من الكمال، متفوقاً بوضوح على الأساليب السابقة بينما استخدم مقداراً مماثلاً أو أقل من الحسابات. أُخذ الحذر لتقسيم البيانات بشكل نظيف، وإزالة الصور المكررة بين مجموعات التدريب والاختبار، والإبلاغ ليس فقط عن الدقة بل أيضاً عن مدى ثقة واتساق النموذج في التمييز بين العلامات. كما فَصّل الباحثون الشبكة قطعةً قطعة، مبينين أن كل مكوّن من مكوّنات الانتباه والدمج يقدّم زيادة معنوية في الأداء.

Figure 2
الشكل 2.

ما يعنيه هذا لتقنيات اليومي

بعبارة بسيطة، تظهر الورقة أنه من الممكن بناء محرك للتعرف على الشعارات يجمع بين دقة البصر والرشاقة. من خلال توجيه شبكة مدمجة للتركيز على التفاصيل المناسبة — عبر الطبقات، وعبر مناطق الصورة، وحتى عبر الترددات — يستطيع LogoXpertNet رصد وتمييز الشعارات في صور صعبة دونُ طلب موارد حوسبة هائلة. يحذر المؤلفون من أن الواقع سيظل يواجه هذه الأنظمة بحالات أصعب، من شعارات جديدة تماماً إلى ضبابية شديدة وغطاء كبير، ويدعون إلى اختبارات أوسع في بيئات غير مسيطَر عليها فعلاً. ومع ذلك، يقدم عملهم مخططاً عملياً لجلب تعرف شعارات دقيق إلى الهواتف والكاميرات والأجهزة اليومية الأخرى.

الاستشهاد: Mumtaz, M.T., Awang, M.K., Saeed, M.U. et al. LogoXpertNet: a novel lightweight logo classification using deep learning. Sci Rep 16, 10956 (2026). https://doi.org/10.1038/s41598-026-45682-z

الكلمات المفتاحية: التعرف على الشعار, التعلم العميق, رؤية الحاسوب, مراقبة العلامة التجارية, الشبكات العصبية خفيفة الوزن