Clear Sky Science · ar

الكشف عن الأشياء على أنظمة SoC الحافة منخفضة القدرة الحاسوبية: معيار قابل للتكرار وإرشادات للنشر

· العودة إلى الفهرس

لماذا تهم الرقائق الصغيرة للكاميرات الذكية

العديد من الأجهزة "الذكية" من حولنا—كاميرات المراقبة والطائرات من دون طيار وأجهزة استشعار المصانع والأجراس الذكية—تحتاج إلى اكتشاف الأشخاص والأشياء في الوقت الحقيقي، لكنها تعتمد على رقائق صغيرة قليلة الطاقة بدلاً من عتاد مراكز البيانات المستهلك للطاقة. تعتمد الشركات غالبًا على نماذج YOLO الشهيرة للكشف عن الأشياء، ومع ذلك فمواصفات السرعة المعلنة لهذه الرقائق تعطي القليل عن كيفية الأداء الفعلي في الميدان. تقدم هذه الورقة فحصًا تجريبيًا صارمًا لكيفية تصرف تسعة متغيرات حديثة من YOLO على ثلاث معالجات Rockchip منخفضة التكلفة شائعة الاستخدام، كاشفةً ما يتحكم فعلاً في السرعة واستهلاك الطاقة والموثوقية عندما تنتقل الذكاء إلى الحافة.

Figure 1
الشكل 1.

ثلاث رقائق يومية تحت المجهر

يركز المؤلفون على ثلاث أنظمة على شريحة تجارية (SoC) التي تشغل بهدوء العديد من أنظمة الرؤية المدمجة: الصغيرة RV1106، والمتوسطة RK3568، والأقوى RK3588. كل واحدة تجمع أنوية معالج عادية مع وحدة معالجة عصبية مخصصة (NPU) وذاكرة خارجية. على هذه المنصات، ينشر الفريق تسعة نماذج YOLO—ثلاث أجيال (YOLOv5, YOLOv8, YOLO11) بثلاثة أحجام (نانو، صغير، متوسط)—كلها مدربة على نفس مجموعة المعايير. يحولون النماذج بعناية إلى صيغة مشتركة، ويكمّونها إلى حساب 8-بت، ويقومون بتجميعها باستخدام أدوات Rockchip، ثم يجرون مئات الاختبارات المؤقتة للحصول على قياسات مستقرة للتأخير، والطاقة، والطاقة المستهلكة لكل إطار معالج.

السرعة ليست كما توحي ورقة المواصفات

إحدى الدروس الأوضح هي أن أرقام النماذج والرقائق التقليدية توقعات سيئة للسرعة الحقيقية. على أبطأ شريحة، حتى أصغر النماذج تستغرق نحو 70–100 مللي ثانية لكل إطار، والنماذج المتوسطة بطيئة للغاية للاستخدام في الوقت الحقيقي. تستطيع الشريحة الأسرع تشغيل نماذج النانو والعديد من نماذج الحجم الصغير قرب معدل 30 إطارًا في الثانية، لكن النماذج الأكبر لا تزال تقصر عن أهداف معدلات الإطارات العالية جدًا. ومن المدهش أن التأخير يتوافق أكثر مع دقة النموذج منه مع عدد العمليات الحسابية أو عدد المعاملات التي يمتلكها. تصاميم YOLO الأحدث والأدق تضيف كتلًا داخلية تعزز الدقة لكنها تصعب تنفيذها على هذه الوحدات العصبية، لذا فـ"الأذكى" غالبًا ما يعني "أبطأ بشكل ملحوظ" على مثل هذا العتاد.

عندما تعود الصور الأكبر والذاكرة المشتركة بالضرر

تُظهر الدراسة أن تكبير صور الإدخال لا يزيد العمل بسلاسة فقط. من الناحية النظرية، مضاعفة العرض والارتفاع يجب أن تجعل التكلفة تنمو أربعة أضعاف، لكن على الرقائق ذات عرض النطاق الترددي المنخفض قد تنمو أسرع من ذلك. مع كبر الصور، لا تعود البيانات الوسيطة تتسع مريحًا ويجب نقلها repeatedly إلى الذاكرة الخارجة عن الشريحة. على أنظمة SoC الصغيرة والمتوسطة، يتحول هذا إلى اختناق مروري: تتباطأ النماذج المتوسطة أكثر بكثير من المتوقع، ويمكن أن يؤدي الاستخدام الكثيف للذاكرة من مهام أخرى إلى تضخيم التأخيرات بنسبة 50–270%. بالمقابل، يتعامل RK3588، بفضل عرض نطاق ذاكرة أعلى بكثير، مع زيادات الدقة بسلاسة تقريبًا ولا يتأثر كثيرًا بزيادة حمل المعالج أو الذاكرة، مما يبرز أن سرعة الذاكرة—وليس القدرة الحاسوبية الخام—غالبًا ما تكون عنق الزجاجة الحقيقي.

Figure 2
الشكل 2.

المزيد من الأنوية والمزيد من الطاقة لا يضمنان الكفاءة

تتضمن أسرع رقائق Rockchip وحدة NPU بثلاثة أنوية، لكن تشغيل YOLO عبر أنوية متعددة يقدم فوائد متواضعة فقط. لمعظم النماذج، تقسيم العمل عبر نواتين أو ثلاث يقلل التأخير بأقل من 10%، وأحيانًا تتدهور الأداء حتى. إن عبء تنسيق الأنوية ومشاركة نفس تجمع الذاكرة يلغي الكثير من المكاسب النظرية. تضيف قياسات الطاقة لبسة أخرى: كل الثلاثة SoC يستهلكون بضعة واط فقط أثناء التشغيل، ومع ذلك يمكن أن تختلف الطاقة المستهلكة لكل إطار بمعامل ثلاثة. يستخدم RK3588 الأعلى فئة طاقة أكبر في أي لحظة لكنه ينهي العمل بسرعة بحيث غالبًا ما يصبح الخيار الأكثر كفاءة في الطاقة، خاصة للنماذج المتوسطة والدقات الأعلى.

خلاصات عملية للأجهزة في العالم الحقيقي

للقُرّاء الذين يفكرون في كاميرات ذكية أو روبوتات أو أجهزة إنترنت الأشياء، الرسالة واضحة. على أصغر الرقائق، فقط أصغر نماذج YOLO عند أحجام صور معتدلة عملية، وحتى في هذه الحالة يكون فيديو الوقت الحقيقي تحديًا. يمكن للرقائق المتوسطة أن تدعم نماذج صغيرة بشكل مريح وأحيانًا نماذج متوسطة إذا أمكن التساهل في معدلات الإطارات أو عمر البطارية. يجعل RK3588 الفئة العالية من المعقول تشغيل متغيرات YOLO الأكثر دقة والمتوسطة الحجم مع الحفاظ على طاقة لكل إطار متحكم بها. عبر اللوحة، تجادل الورقة بأن المصممين يجب أن يختاروا النماذج مع أخذ العتاد بعين الاعتبار، وينتبهوا جيدًا إلى عرض نطاق الذاكرة، ويفضلوا حيل توفير الذاكرة بدل السعي وراء شبكات أكبر وأكبر. ما يهم في النهاية ليس العمليات التيرا في الثانية المعلنة، بل ما إذا كان النظام بأكمله قادرًا على تقديم كشف للأشياء سريع ومستقر وموفر للطاقة في ظروف العالم الحقيقي الفوضوية.

الاستشهاد: Kong, C., Li, F., Yan, X. et al. Object detection on low-compute edge SoCs: a reproducible benchmark and deployment guidelines. Sci Rep 16, 5875 (2026). https://doi.org/10.1038/s41598-026-36862-y

الكلمات المفتاحية: الذكاء الاصطناعي على الحافة, الكشف عن الأشياء, الرؤية المدمجة, نماذج YOLO, نظام على شريحة منخفض الطاقة