Clear Sky Science · ar

شبكة تنافسية توليدية تلافيفية ذات سياق مزاحي عميق مع ميزات نقاط زاوية مستخرجة لتصنيف المكسرات

· العودة إلى الفهرس

فرز أذكى للمكسرات اليومية

من خلطات الوجبات الخفيفة إلى زبدات المكسرات، تتحرك مليارات المكسرات عبر المصانع كل عام، ويجب فرز كل واحدة حسب النوع والجودة. في الوقت الحالي يتم ذلك غالبًا بواسطة آلات لا تزال تواجه صعوبات عندما تبدو المكسرات متشابهة أو تُلتقط الصور تحت إضاءة مختلفة. تقدم هذه الدراسة نظام ذكاء اصطناعي قويًا يُدعى DAC‑GAN قادرًا على التمييز بين ثمانية أنواع شائعة من المكسرات بدقة تكاد تكون كاملة، ما يعد بفرز أسرع وأرخص وأكثر موثوقية لصناعة الغذاء.

لماذا التعرف على المكسرات صعب

للنظر للمرة الأولى، قد يبدو التعرف بين الكاجو والفول السوداني سهلًا. لكن في خطوط الإنتاج الحقيقية، قد تكون المكسرات مائلة أو مكسورة أو متداخلة أو ضعيفة الإضاءة. تعتمد البرامج التقليدية على إشارات مصممة يدويًا بسيطة، مثل اللون أو الشكل المتوسط، والتي تنهار بسهولة عندما تتغير الظروف. حسنًا، حسّن التعلّم العميق الأمور بتمكين الحواسيب من تعلم الأنماط مباشرة من الصور، لكن هذه الأساليب عادةً ما تتطلب مجموعات بيانات كبيرة ومتوازنة بعناية. بالنسبة للمكسرات، قد تتوفر فقط عدة آلاف من الصور الموسومة، وبعض الأصناف قد تبدو متشابهة لدرجة التسبب في أخطاء وتحيز في التنبؤات.

إنشاء مزيد من صور التدريب الأفضل

بدأ الباحثون بمجموعة صور عامة اسمها «المكسرات الشائعة»، التي تحتوي على 4000 صورة موزعة بالتساوي عبر ثمانية أنواع من المكسرات: جوز البرازيل، الكاجو، الكستناء، الفول السوداني، البقان، الفستق، الماكاديميا والجوز. من أجل تدريب نموذج قوي، يحتاجون إلى أمثلة أكثر بكثير من ذلك. يتعامل DAC‑GAN مع المشكلة باستخدام نوع خاص من الشبكات العصبية يُدعى الشبكة التنافسية التوليدية (GAN). يتعلم جزء من الشبكة، المولّد، إنشاء صور مكسرات واقعية من ضوضاء عشوائية، بينما يتعلم الجزء الآخر، المميّز، التفريق بين الحقيقي والمزوّر. مع تنافسهما، يصبح المولّد جيدًا بما يكفي لإنتاج مكسرات صناعية عالية الجودة وواقعية. من خلال دمج هذه الصور الاصطناعية مع قلبات ودورات اعتيادية، يوسّع الفريق مجموعة البيانات إلى أكثر من 70,000 صورة مع الحفاظ على توازن مثالي لكل فئة من فئات المكسرات.

Figure 1
الشكل 1.

تعليم النموذج التركيز على تفاصيل المكسرات

إضافة مزيد من الصور وحدها لا تكفي؛ يجب أن يركّز النموذج أيضًا على الإشارات البصرية الصحيحة. يقدم DAC‑GAN خطوة ترشيح تحوّل صور المكسرات إلى تدرّج الرمادي ثم تستخرج المخططات القوية والحواف ونقاط الزاوية المميزة. تلتقط هذه «ميزات نقاط الزاوية الرئيسية» الأماكن التي ينحني فيها شكل المكسر أو تتغير فيها نسيج سطحه، وهي تفاصيل غالبًا ما تميز صنفًا عن آخر. تبرز مرشحات إضافية مخططات النواة العامة والأنماط الداخلية. بدلاً من إطعام الصور الخام إلى المصنّف، يعمل النظام على هذه الصور المميزة المُحسّنة، التي تُبرز الهندسة والملمس مع تقليل تأثير الخلفية وتباينات اللون المشتتة.

رؤية المكسر الكامل على مقاييس متعددة

جوهر DAC‑GAN هو نسخة مصقولة من تقنية تُعرف باسم الالتفاف المزاح، أو التلافيف المتوسعة (atrous). طبقات الالتفاف الاعتيادية في الشبكات العميقة ترى رقعًا صغيرة فقط في كل مرة. يباعد الالتفاف المزاح نقاط العيّنة بحيث يستطيع النموذج إدراك مجال أوسع دون فقدان الدقّة. يضيف المؤلفون كتلتي «ما قبل السياق» و«ما بعد السياق» حول هذه العملية الأساسية، لتلخيص الصورة بأكملها وإرجاع هذا الملخّص إلى الطبقة. بتشغيل ثلاث عمليات تلافيف مماثلة بمعدلات توسعة مختلفة، يتعلم الشبكة التقاط كل من الأخاديد الصغيرة على سطح المكسر والمخطط الظاهر العام، ثم يجمع هذه المناظير في تمثيل غني وواعٍ للسياق قبل اتخاذ القرار.

Figure 2
الشكل 2.

ما مدى فعاليته؟

يضع الفريق DAC‑GAN من خلال سلسلة اختبارات واسعة. يقارنونه بالعديد من الشبكات العصبية المعروفة، من نماذج كلاسيكية مثل VGG وResNet إلى تصاميم أحدث قائمة على المحولات، سواء مع البيانات الاصطناعية أو بدونها. عبر المقاييس مثل الدقة والدقة الاحصائية والاستدعاء ومقياس F1 المركب، يتفوّق DAC‑GAN باستمرار على البدائل بفارق كبير. على مجموعة الاختبار المحتجزة من صور المكسرات الحقيقية، يحدد النوع بشكل صحيح في 99.83% من الحالات، مع 25 خطأ فقط من أصل 800 عينة. حتى أقوى النماذج المنافسة تتأخر عدة نقاط مئوية، وتُظهر الإحصاءات التفصيلية أن ميزة DAC‑GAN ليست مصادفة بل متينة إحصائيًا.

ماذا يعني هذا للغذاء وما بعده

بالنسبة لغير المتخصصين، الخلاصة بسيطة: من خلال اختراع صور تدريب إضافية بذكاء وتعليم الشبكة الانتباه إلى الحواف والزوايا والسياق متعدد المقاييس، يحول DAC‑GAN مشكلة بصرية دقيقة إلى مشكلة يمكن حلها تقريبًا بدقة تامة. عمليًا، قد تؤدي هذه الطريقة إلى آلات فرز مكسرات مؤتمتة تتعامل مع أحجام كبيرة بأخطاء قليلة جدًا، محسنّة مراقبة الجودة ومقلّلة العمل اليدوي. وبما أن الأسلوب عام، فيمكن أيضًا تكييفه لمنتجات غذائية أخرى—أو حتى قطع صناعية—التي يجب تمييزها بناءً على تفاصيل بصرية دقيقة تحت ظروف تصوير غير مثالية.

الاستشهاد: Devi, M.S., Jaiganesh, M., Priya, S. et al. Deep atrous context convolution generative adversarial network with corner key point extracted feature for nuts classification. Sci Rep 16, 6409 (2026). https://doi.org/10.1038/s41598-026-36238-2

الكلمات المفتاحية: تصنيف المكسرات, التعلّم العميق, زيادة بيانات الصور, فرز الأغذية, رؤية حاسوبية