Clear Sky Science · ar

شبكات عصبية عميقة تشتتية مضادة للتداخل للتعرّف على عدة أشياء

2026-02-03 · العودة إلى الفهرس

رؤية الإشارة في عالم مُزعج

الحياة الحديثة مليئة بالكاميرات وأجهزة الاستشعار التي يجب أن تلتقط الأشياء المهمة في المشهد – مشاة على الطريق، ورم صغير في فحص طبي، أو جسم مريب في حشد – حتى عندما تكون محاطة بالفوضى. تعرض هذه الورقة نوعًا جديدًا من الشبكات العصبية «البصرية بالكامل» التي تقوم بمعظم هذا التعرّف باستخدام الضوء نفسه بدلاً من الدوائر الإلكترونية. النتيجة نظام قادر على تمييز الأجسام المختارة في مشاهد مزدحمة ومتغيرة بينما يعامل كل ما عداها كضوضاء خلفية غير ضارة، مما قد يمكّن رؤية أسرع وأكثر كفاءة في استهلاك الطاقة للآلات المستقبلية.

لماذا تهم الحواسيب المصنوعة من الضوء

تعمل أنظمة التعلم العميق التقليدية على معالجات إلكترونية تحرك تيارات عبر مليارات المفاتيح الصغيرة. هي قوية لكنها بطيئة أيضًا عندما يجب اتخاذ قرارات في ميكروثانية، وتبدد الكثير من الطاقة على شكل حرارة. يقدم الضوء بديلاً جذابًا: الحزمات الضوئية قادرة على حمل كم هائل من المعلومات بالتوازي، وتسير بسرعة الحد النهائي، ولا تسخّن الدوائر بنفس طريقة التيارات الكهربائية. تستغل الشبكات العصبية البصرية هذه المزايا من خلال تشكيل الضوء بأسطح مصممة بعناية بحيث يقوم الحزمة المارة خلالها عمليًا بـ«حساب» نتيجة مسألة التعرّف.

من كائن واحد إلى مشاهد مزدحمة

تقتصر معظم الشبكات العصبية البصرية الحالية على مهمات بسيطة، مثل تحديد أي رقم واحد مُطبَع في وسط صورة نظيفة. تتعثر عندما تظهر عدة أشياء معًا أو تتداخل أو تتحرك – بالضبط الظروف الموجودة في المشاهد الحقيقية. المحاولات السابقة للتعامل مع أهداف متعددة كانت كثيرًا ما تتطلب قواعد صارمة بشأن مواضع ظهور كل جسم أو اعتمدت على معالجة إلكترونية إضافية بعد مرحلة الضوء، مما يقلل من مكاسب السرعة والكفاءة الطاقية للطريقة البصرية.

تعليم الضوء تجاهل المشتتات

يقدم المؤلفون «شبكة عصبية عميقة تشتتية مضادة للتداخل»، أو AI D2NN، التي تتعامل مباشرة مع المشاهد المزدحمة. تتألف من طبقتين نمطيتين فائقتي الرقة فقط – أسطح فائقة – يمر بهما حزمة من ضوء التيراهرتز. تصمم هذه الطبقات عبر تدريب حاسوبي بحيث يتم توجيه ضوء الأجسام المستهدفة، هنا الأرقام المكتوبة يدويًا من 0 إلى 5، إلى واحدة من ست بُقَع صغيرة مشرقة على مستوى الخرج، بُقعة لكل رقم. في الوقت نفسه، يتم عمدًا تشويش ضوء كل شيء آخر – أرقام أخرى، صور ملابس، حروف، ومجموعات عشوائية منها – إلى هالة خافتة شبه موحدة لا تُشغّل أي بُقعة خرج.

بناء واختبار حاسوب ضوئي فعلي

لتحويل التصميم المدرب إلى أجهزة، صنّع الفريق أسطحًا فائقة من السيليكون مكوّنة من أعمدة أسطوانية دقيقة تؤخر مرور الضوء بمقادير محددة. مرتبة في شبكة 100 في 100، تعمل هذه الأعمدة كـ«عوَصِب بصري» تؤدي تأثيرًا مجمعًا يحقق الشبكة المتعلمة. اختبر الباحثون النظام بحزمات تيراهرتز مُشكَّلة لعرض تراكيب من الأرقام المستهدفة و40 نوعًا مختلفًا من الأشكال المشتتة، وُضِعت في مواضع وأحجام عشوائية لمحاكاة مشاهد متحركة ومزدحمة. في المحاكاة الحاسوبية، تعرفت الشبكة البصرية بشكل صحيح على الأرقام المختارة في حوالي 87 بالمئة من هذه الحالات الصعبة، وحققت منظومة تجريبية فعلية تقريبًا نفس الدقة، ما يُثبت أن المفهوم يعمل خارج نموذج الحاسوب.

ما معنى هذا للآلات المستقبلية

بعبارات بسيطة، يُظهر هذا العمل أنه من الممكن بناء جهاز بصري ورقي الرقة ينظر عبر الفوضى وما يزال يكتشف الكائن الذي يهمه، مستخدمًا طاقة ضئيلة جدًا ويعمل بسرعة الضوء. وبما أن التصميم يعتمد على خصائص عامة للحيود، فيمكن تطبيق الفكرة على ألوان أو أطوال موجية مختلفة من الضوء ودمجها مع حيل بصرية أخرى للتعامل مع عدد أكبر بكثير من فئات الأجسام دفعة واحدة. مع مزيد من التحسين، قد تساعد شبكات بصرية مضادة للتداخل مماثلة السيارات ذاتية القيادة على تحديد مستخدمي الطريق الرئيسيين بسرعة، أو تساند الأطباء في الإشارة إلى معالم مريبة في الفحوصات في الوقت الحقيقي، أو تدعم كاميرات أمنية خفيفة الوزن تكشف التهديدات دون معالجة إلكترونية كثيفة.

الاستشهاد: Huang, Z., Liu, Y., Zhang, N. et al. Anti-interference diffractive deep neural networks for multi-object recognition. Light Sci Appl 15, 101 (2026). https://doi.org/10.1038/s41377-026-02188-7

الكلمات المفتاحية: الشبكات العصبية البصرية, التعرّف على عدة أشياء, الأسطح الفائقة, تصوير التيراهرتز, الحوسبة البصرية الكاملة