Clear Sky Science · ar
محرك معالجة موترات ثلاثي الأبعاد ضوئي مدمج
لماذا تهم آلات التفكير الأسرع
من السيارات ذاتية القيادة إلى أجهزة المسح الطبي والواقع الافتراضي، يعتمد عالمنا بصورة متزايدة على حواسب قادرة على فهم بيانات ثلاثية الأبعاد معقدة في الزمن الحقيقي. أنظمة الذكاء الاصطناعي الحالية قوية، لكن الشرائح الإلكترونية التي تشغّلها تتعرض لضغط متزايد مع الطلب على شبكات عصبية أكبر وأسرع. تعرض هذه الورقة طريقة جديدة للتعامل مع بيانات ثلاثية الأبعاد باستخدام الضوء بدلاً من الكهرباء، واعدة بآلات "تفكير" أسرع وأكثر كفاءة قد تجعل السيارات أكثر أماناً، والتشخيصات أسرع، والتجارب على الإنترنت أكثر غنى.
من الصور المسطحة إلى عوالم ثلاثية الأبعاد
تعمل العديد من أنظمة الذكاء الاصطناعي المألوفة على صور ثنائية البعد—شبكات بكسلات مسطحة—باستخدام ما يُعرف بالشبكات العصبية الالتفافية. لكن الحساسات الحديثة، مثل أجهزة المسح الطبي ومستشعرات الليدار (LiDAR) القائمة على الليزر في المركبات الذاتية، تلتقط مشاهد ثلاثية الأبعاد كاملة مع مرور الزمن. تُوصف مجموعات البيانات الأكثر ثراءً هذه بشكل طبيعي على أنها «موترات» أو مصفوفات متعددة الأبعاد. معالجة هذه الموترات بشبكات عصبية ثلاثية الأبعاد قوية للغاية لكنها أيضاً متطلبة للغاية: فكمية الحساب والذاكرة المطلوبة تنمو بسرعة مع كل بعد مضاف. المعجلات الإلكترونية التقليدية مثل وحدات معالجة الرسوميات (GPUs) ووحدات تسريع التعلم الآلي (TPUs) مُصممة أساساً للتعامل مع عمليات مصفوفية ثنائية الأبعاد، لذا فهي تضطر باستمرار لإعادة تشكيل وتبديل بيانات ثلاثية الأبعاد، مما يهدر الوقت والطاقة والذاكرة.

ترك الضوء يقوم بالأعمال الشاقة
يقدّم الباحثون محرك معالجة موترات ثلاثي الأبعاد ضوئي مدمج يقوم بخطوة أساسية من شبكات عصبية ثلاثية الأبعاد مباشرة بالضوء. بدلاً من نقل البيانات مراراً بين الذاكرة والمعالجات الإلكترونية، يرسل نظامهم المعلومات كإشارات ضوئية تنتقل عبر موجّهات ورنانات دقيقة على الشريحة. يتم ترميز ومعالجة البيانات في آن واحد عبر ثلاثة «محاور» مختلفة: لون الضوء (الطول الموجي)، والوقت الذي تمر فيه النبضات، والمسارات الفيزيائية التي تسلكها عبر الشريحة. من خلال تداخل هذه الأبعاد الثلاثة، يمكن للنظام التعامل مع عمليات الالتفاف ثلاثية الأبعاد كاملة دون تقطيعها إلى مهام أصغر كثيرة أو الاعتماد على أجهزة تحكم إلكترونية ضخمة.
ذاكرة بصرية مدمجة ومزامنة
تحدٍ مركزي في الحوسبة عالية السرعة هو الحفاظ على محاذاة دقيقة زمنياً لعدة قنوات بيانات. تستخدم الأنظمة التقليدية دوائر تزامن إلكترونية معقدة ومخازن ذاكرة كبيرة لتحقيق ذلك. هنا، تحلّ الفرقة المشكلة بالكامل في المجال البصري. أضاف الفريق وحدتين ذاكرة بصريتين، مصنعتين من خطوط تأخير قابلة للضبط، قبل وبعد كتلة الحوسبة الرئيسية. تعمل هذه الخطوط كغرف انتظار قابلة للتعديل لنبضات الضوء، مما يسمح للنظام "بتخزين" البيانات ومزامنة القنوات ببساطة عن طريق تغيير مدة سفر كل نبضة على الشريحة. يمكن ضبط التأخيرات بدقة بحدود البيكوثانية (جزء من تريليون من الثانية) وتدعم معدلات إيقاع فعالة تصل إلى نحو مئتي مليار عملية في الثانية، وكل ذلك دون اللجوء إلى أجهزة توقيت إلكترونية إضافية.
دوائر ضوئية أذكى للرياضيات الثقيلة
في قلب كتلة الحوسبة توجد شبكة من الرنانات الضوئية الدائرية الصغيرة التي تتحكم في مدى مساهمة كل قناة ضوئية في النتيجة النهائية—بمثابة الأوزان القابلة للضبط في شبكة عصبية. يستخدم المؤلفون تصميمًا مزدوج الحلقة على منصة فوتونية متعددة الطبقات يجعل هذه العناصر أقل حساسية لتغيرات الحرارة وعيوب التصنيع، مع تقديم استجابة بصرية واسعة ومسطّحة. هذا يعني أن الحلقات يمكنها معالجة إشارات عالية السرعة بتشويه أقل والحفاظ على إعدادات الأوزان بدقة—أفضل من دقة تعادل 7 بت تقريبًا—باستخدام معايرة بسيطة. في الاختبارات، نفّذت الشريحة ضربات مصفوفية بأربع قنوات بسرعة رمزية تصل إلى 30 جيجابود، مبرهنةً على السرعة والدقة معاً.

اختبار واقعي مع استشعار ليزري ثلاثي الأبعاد
لإظهار أن محركهم مفيد خارج معايير المختبر، طبق الفريق النظام على مشكلة عملية في التعرّف ثلاثي الأبعاد: التمييز بين المشاة والمركبات في بيانات سحابة نقاط LiDAR. استخدموا شبكة عصبية ثلاثية الأبعاد مدمجة مشابهة لنماذج الوقت الحقيقي المعروفة، درّبوا معاييرها رقمياً، ثم فوّضوا خطوة الالتفاف ثلاثي الأبعاد الحاسمة إلى المحرك الضوئي. عند تشغيله بمعدل رمزي 20 جيجابود، أنتج النظام الضوئي خرائط ميزات تطابقت عن كثب مع الحسابات الرقمية وحقق دقة تصنيف تقارب 97 بالمئة—بنفس فعالية الحاسب التقليدي، لكن مع تنفيذ الرياضيات الثلاثية الأبعاد الثقيلة بالضوء.
ماذا يعني هذا لتقنيات الحياة اليومية
بعبارة بسيطة، تُظهر هذه الدراسة أنه من الممكن بناء "محرك رياضي" بصري مدمج يتعامل مباشرة مع أصعب جزء من أحمال عمل الذكاء الاصطناعي ثلاثي الأبعاد، مع استخدام ذاكرة أقل ومكونات إلكترونية أقل وربما طاقة أقل بكثير من التصميمات الحالية. من خلال إبقاء التخزين المؤقت للبيانات ومحاذاة التوقيت والحوسبة كلها في المجال البصري، يقلّل النهج من التعقيد ويفتح الطريق لسرعات أعلى وتوازي أكبر. مع تحسّن التكامل الفوتوني ونضج مصادر الضوء والمكبّرات على الشريحة، يمكن أن تصبح محركات الموترات ثلاثية الأبعاد هذه عناصر بناء رئيسية في أجهزة المستقبل للقيادة الذاتية، والتصوير الطبي، وتحليل الفيديو، وبيئات الواقع الغامر—تستخدم أشعّة الضوء بهدوء لمساعدة الآلات على رؤية وفهم عالمنا الثلاثي الأبعاد في الزمن الحقيقي.
الاستشهاد: Wu, Y., Ni, Z., Li, X. et al. Integrated photonic 3D tensor processing engine. Light Sci Appl 15, 154 (2026). https://doi.org/10.1038/s41377-026-02183-y
الكلمات المفتاحية: الحوسبة الضوئية, الشبكات العصبية ثلاثية الأبعاد, معجلات بصرية, تمييز LiDAR, معالجة الموترات