Clear Sky Science · ar

اصطدامات الميزات الدقيقة في الشبكات العصبية

· العودة إلى الفهرس

عندما تخدع صور مختلفة آلة ذكية

يمكن لأنظمة الذكاء الاصطناعي الحديثة التعرف على الوجوه وقراءة الأشعات الطبية وتوجيه السيارات ذاتية القيادة. نعلم بالفعل أنها قابلة للخداع بتعديلات صغيرة ومصممة بعناية على الصورة. تُظهر هذه الورقة أمراً أكثر إثارة للدهشة: أن نفس الشبكات يمكن أن تكون عمياء تجاه تغييرات كبيرة وواضحة، فتتعامل مع صور مختلفة تماماً كما لو كانت واحدة. فهم كيفية وسبب حدوث ذلك أمر حاسم إذا أردنا أن نثق فعلاً بأنظمة الذكاء الاصطناعي.

Figure 1
الشكل 1.

من لمسات دقيقة إلى نقاط عمياء كبيرة

تشغّل الشبكات العصبية العميقة الإنجازات الحالية في الرؤية واللغة والعديد من المجالات الأخرى. أظهرت أبحاث سابقة حول الأمثلة العدائية أن تغييراً ضئيلاً قد لا يكاد يُرى في الصورة قد يدفع الشبكة إلى تصنيف خاطئ بثقة عالية. وكشفت أعمال أحدث عن المشكلة العكسية: بعض الشبكات تكاد لا تتأثر بتغييرات كبيرة وواضحة وتنتج توقعات متطابقة تقريباً. في تلك الحالات، تت «اصطدم» الميزات الداخلية المستخرجة من صورتين مختلفتين، أي تمثلها الشبكة بطريقة تقارب بعضها البعض. تذهب هذه الدراسة أبعد من ذلك بكثير، وتثبت أن الشبكات الشائعة لا تقتصر على اصطدامات تقريبية فحسب، بل يمكن أن تحدث اصطدامات ميزات دقيقة تماماً، حيث تُصوَّر مدخلتان مختلفتان بنفس الإشارات الداخلية بالضبط.

كيف تنشأ الاصطدامات داخل الشبكة

لفهم هذه الاصطدامات، ينظر المؤلفون إلى ما وراء الشاشة ويركزون على مصفوفات الأوزان في الشبكات العصبية، وهي الأرقام المتدربة التي تربط طبقة بأخرى. يحدث اصطدام للميزات عندما تنتج مدخلتان مختلفتان نفس المخرج عند طبقة ما؛ وبمجرد حدوث ذلك، ترى كل الطبقات اللاحقة نفس الشيء وبالتالي لا تستطيع التمييز بين المدخلين. رياضياً، يحدث هذا عندما يكمن الفرق بين مدخلين في «فضاء الصفري» لمصفوفة أوزان طبقة ما: أي اتجاهات في فضاء المدخلات تتجاهلها الطبقة تماماً. يبين المؤلفون أنه كلما كانت لمصفوفة الأوزان قيمة ذاتية صفرية أو كانت ترسم من فضاء أبعاده أعلى إلى فضاء أقل بعداً، فلا بد من وجود مثل هذه الاتجاهات المتجاهَلة. وبما أن معظم البنى المستخدمة في العالم الحقيقي، بما في ذلك النماذج الشائعة للتصنيف والتجزئة والكشف عن الأجسام، تتضمن الكثير من هذه الطبقات، فالإصطدامات ليست حالات نادرة على الهامش بل خاصية تكاد تكون حتمية لهذه الشبكات.

طريقة جديدة لبناء مدخلات متصادمة

استناداً إلى هذه البصيرة، تقدم الورقة وصفة عملية تسمى «بحث فضاء الصفري». بدلاً من الاعتماد على المحاولات والخطأ أو حيل قائمة على التدرج، تستخدم هذه الطريقة مباشرة فضاء الصفري لمصفوفة الأوزان الأولى. بدءاً من أي صورة، يحسب المؤلفون متجهاً تتجاهله الطبقة الأولى، ثم يضيفون نسخة مقيَّسة من هذا المتجه إلى الصورة. وبما أن هذا الاتجاه غير مرئي للطبقة، تظل الميزات الداخلية للشبكة — والتنبؤ النهائي — كما هي تماماً، حتى لو بدا أن الصورة نفسها مُشوّهة بشدة للمراقب البشري. تمتد الفكرة نفسها إلى الطبقات الالتفافية ومستقلاً إلى الطبقات اللاحقة أيضاً. يستعرض المؤلفون العديد من النماذج القياسية ويجدون أن معظمها يحتوي على العديد من هذه الاتجاهات المتجاهَلة، ما يعني أنه يمكن توليد عدد لا يحصى من الصور المتصادمة بهذه الطريقة لمجموعة واسعة من المهام.

Figure 2
الشكل 2.

مخاطر خفية على المقاييس الشبيهة والتفسيرات والأمن

للاصطدامات الدقيقة للميزات عواقب بعيدة المدى. صورتان لهما ميزات متصادمة لن تشتركا في نفس التنبؤ فحسب، بل غالباً ما ستشتركان أيضاً في خرائط الشرح التي تنتجها أدوات التفسير الشائعة. قد يجعل ذلك صورة مشوّهة وغير قابلة للتعرّف تبدو مدعومة بنفس قدر الصور النظيفة، مما يقوض الثقة في طرق الشرح. وتؤثر المشكلة أيضاً على مقاييس التشابه القائمة على الميزات التي تعتمد على الشبكات العصبية: فقد تقر هذه المقاييس أن صورة مُفسدة بشدة "مطابقة" للأصل لأن الميزات تتطابق تماماً، رغم أن مقاييس قائمة على البكسل تشير بوضوح إلى اختلافات كبيرة. أخيراً، يمكن دمج بحث فضاء الصفري مع هجمات عدائية قياسية، فتصنع العديد من الصور العدائية المختلفة التي تنتج جميعها نفس التنبؤ الخاطئ وتبقى ضمن حدود التغيير القياسية، ما يعمق المخاوف الأمنية القائمة.

ماذا يعني هذا لبناء ذكاء اصطناعي أكثر أماناً

بعبارات بسيطة، تُظهر هذه الدراسة أن شبكات اليوم غالباً ما تتخلص من معلومات بطرق متوقعة، تاركة اتجاهات كاملة في فضاء المدخلات لا تؤثر على قراراتها على الإطلاق. يمكن للمهاجمين استغلال هذه النقاط العمياء لإنشاء صور غريبة أو عدائية تعاملها الشبكة على أنها مطابقة للصور العادية. يقترح المؤلفون استخدام عدّات بسيطة لهذه الاتجاهات المتجاهَلة كوسيلة لقياس مدى ضعف النموذج، ويَرجِحون أن الشبكات الأرفع والأفضل تنظيماً والتي تملك فضاءات صفرية أصغر قد تكون أكثر صلابة. وبينما يبقى الكثير لاختباره عملياً، فإن الرسالة الأساسية واضحة: إذا أردنا ذكاء اصطناعي يمكن الاعتماد عليه، فعلينا الانتباه ليس فقط لما تستجيب له الشبكات، بل أيضاً لما تتجاهله.

الاستشهاد: Ozbulak, U., Rao, S., De Neve, W. et al. Exact feature collisions in neural networks. Sci Rep 16, 10139 (2026). https://doi.org/10.1038/s41598-026-40605-4

الكلمات المفتاحية: الشبكات العصبية, أمثلة عدائية, اصطدامات الميزات, صلابة النموذج, بحث فضاء الصفري