Clear Sky Science · ar

رسم خرائط فعّالة لتطبيقات التعلم العميق على أجهزة دقيقة مختلطة باستخدام سوبرنتورك وتكييف النموذج

2026-03-27 · العودة إلى الفهرس

لماذا تهم شرائح الذكاء الاصطناعي الأذكى

يقود الذكاء الاصطناعي الحديث الكثير من التطبيقات بدءًا من مساعدات الصوت إلى تحليل الصور الطبية، لكن الحواسيب التي تشغّل هذه الأنظمة تواجه ضغوطًا متزايدة. مع توسع النماذج تصبح أكثر طلبًا للطاقة والذاكرة والوقت لإجراء التنبؤات. تستكشف هذه الورقة طريقة جديدة لمطابقة برمجيات الذكاء الاصطناعي مع أجهزة متخصّصة بحيث تعمل الأنظمة أسرع وبطاقة أقل مع الحفاظ على الدقة. تركز الدراسة على الجمع بين نوعين من الحوسبة — التماثلية والرقمية — وعلى اتخاذ قرار آلي بشأن أي أجزاء الشبكة العصبية يجب أن تعمل على أي منهما.

نوعان من «الدماغ» لآلة واحدة

بدأت شرائح الذكاء الاصطناعي الحديثة تدمج وحدات رقمية تقليدية مع محركات تماثلية "داخل الذاكرة" قادرة على أداء كتل كبيرة من العمليات الحسابية داخل الذاكرة نفسها. الوحدات التماثلية سريعة للغاية وموفّرة للطاقة، لكنها أيضًا ضوضائية وأقل دقة. بالمقابل، الوحدات الرقمية أبطأ وأقل كفاءة ولكنها موثوقة بدرجة عالية. التحدي الرئيسي هو تقرير، طبقة تلو الأخرى، أين يجب أن تعمل شبكة عصبية تماثليًا وأين يجب أن تبقى رقمية بحيث يعمل النظام ككل بصورة جيدة. إذا عملت طبقات كثيرة جدًا تماثليًا تنخفض الدقة؛ وإذا بقيت الكثير منها رقمية تختفي مكاسب الطاقة والسرعة إلى حد كبير.

Figure 1. كيف تتدفق مهام الذكاء الاصطناعي عبر الأجهزة التماثلية والرقمية لتقديم نتائج سريعة ودقيقة وموفرة للطاقة.

خريطة للعديد من الشبكات الممكنة

يعرض المؤلفون سوبرنتورك الدقة المختلطة، وهو نموذج شامل كبير يحتوي على العديد من الإصدارات الممكنة لنفس الشبكة العصبية في وقت واحد. لكل طبقة، يتضمن هذا السوبرنتورك عدة خيارات: نسخة رقمية بدقّات بت مختلفة، نسخة تماثلية تتضمن ضوضاء واقعية، وحتى إمكانية تخطي أو إعادة تشكيل الطبقات. خلال التدريب، يتعلم النظام ليس فقط الأوزان التقليدية للشبكة، بل أيضًا مدى جودة كل خيار للأجهزة لكل طبقة. ثم تبحث طريقة تصنيف خاصة في فضاء هذه الخيارات لإيجاد "خرائط" محددة طبقة طبقة توازن بين ثلاثة أهداف في نفس الوقت: دقة المهمة، مقدار العمل المنفّذ على الأجهزة التماثلية، وكمية الذاكرة الرقمية المطلوبة.

تعليم النموذج ليلائم الأجهزة

بخلاف الاختيار بين التماثلي والرقمي، يستطيع الإطار أن يعيد تشكيل الشبكة بلطف لتتلاءم مع الأجهزة بشكل أكثر طبيعية. على سبيل المثال، يمكنه توسيع بعض الطبقات الداخلية في محول أو كتلة الالتفاف بحيث تملأ بلاطة تماثلية بشكل أكمل، مستخدمًا المزيد من الصفوف والأعمدة المتاحة دون إضافة تأخير. تزيد هذه التعديلات الواعية للأجهزة عدد المعلمات في بعض الطبقات، ولكن بما أنها توضع حيث تكون الأجهزة التماثلية فعّالة، يبقى إجمالي تكلفة الطاقة منخفضًا. يتدرّب النظام على مراحل: أولًا يعامل كل المسارات بعدل، ثم يدخل تدريجيًا التقنين الحقيقي وضوضاء التماثل، وأخيرًا يُجري ضبطًا دقيقًا للاختيارات للحفاظ على أفضل مفاضلات بين الدقة والكفاءة.

Figure 2. كيف يتم تخصيص كل طبقة في الشبكة العصبية للأجهزة التماثلية أو الرقمية لموازنة الدقة واستهلاك الطاقة والسرعة.

بحث أسرع ومفاضلات أفضل

اختبر الفريق منهجهم على عدة مهام معيارية: تصنيف الصور على CIFAR‑10، تقسيم الكائنات على مجموعة بيانات COCO، والإجابة عن الأسئلة على SQuAD. عبر هذه الاختبارات، وجدت طرقهم، المسماة MPS ونسخة MPAAS الأكثر تقدماً، خرائط استخدمت نسبة عالية من العمليات التماثلية مع الحفاظ على الدقة أو حتى تحسينها قليلًا مقارنة بالخطوط الأساسية الشائعة. في المتوسط، تم اكتشاف خرائطهم بحوالي 2.2 مرة أسرع من الطرق المنافسة ووفّرت تحسينًا في أداء المهمة بنحو 3.4 بالمائة مقارنة بتصميم تماثلي كامل. أظهرت محاكيات الأجهزة أن التصاميم الناتجة يمكن أن تقلّص زمن الاستجابة بما يصل إلى نحو 2.4 مرة والطاقة لكل تنبؤ بحوالي 2.6 مرة مقارنةً بالأنظمة الرقمية ذات الدقة الكاملة.

ماذا يعني هذا لمستقبل أجهزة الذكاء الاصطناعي

بالنسبة لغير المتخصصين، الرسالة الرئيسية هي أن طريقة وضع نموذج الذكاء الاصطناعي على الشريحة تهم تقريبًا بقدر أهمية النموذج نفسه. تُظهر هذه الدراسة أن "مخططًا" آليًا واعيًا للأجهزة يمكنه أن يقرر أي أجزاء الشبكة يجب أن تعمل على أجهزة تماثلية سريعة لكن ضوضائية وأيها يجب أن تبقى على وحدات رقمية دقيقة، وأحيانًا يعيد تشكيل النموذج ليلائم الشريحة بشكل أفضل. النتيجة هي ذكاء اصطناعي قادر على تقديم دقة مماثلة باستخدام طاقة ووقت أقل بكثير، وهو تقدم مهم لجعل النماذج القوية عملية في أجهزة مثل الهواتف والسيارات وخوادم الحافة بدلًا من الاقتصار على مراكز البيانات الكبيرة.

الاستشهاد: Benmeziane, H., Lammie, C., Boybat, I. et al. Supernetwork-based efficient mapping of deep learning applications to mixed-precision hardware using model adaptation. Nat Commun 17, 4501 (2026). https://doi.org/10.1038/s41467-026-71071-1

الكلمات المفتاحية: أجهزة ذات دقة مختلطة, الحساب التماثلي داخل الذاكرة, رسم خرائط الشبكات العصبية, الذكاء الاصطناعي الواعي للأجهزة, استدلال موفّر للطاقة