Clear Sky Science · ar
مقاومات متغيرة من الدرجة الثانية مدفوعة بتدرج الأكسجين الداخلي للتعلّم التعزيزي المستمر
لماذا يهم تعليم الأجهزة على التعلم
تتحسّن الحواسيب في التعلم من الخبرة، لكن معظم الذكاء الاصطناعي اليوم يعمل كليًا في البرمجيات على شرائح تستهلك طاقة كبيرة. في المقابل، يخزن دماغنا المعلومات ويعالجها في نفس المكان، باستخدام تدفقات بطيئة ودقيقة من الأيونات تتكيف طبيعيًا مع الزمن. تقدّم هذه الورقة نوعًا جديدًا من المكونات الإلكترونية التي تُحاكي تلك التدرجات الداخلية الرقيقة، مما يسمح للأجهزة بضبط سرعة تعلمها بتغير المهمة والبيئة. قد تؤدي هذه الأجهزة يومًا إلى آلات أكثر كفاءة تشبه الدماغ وقادرة على التعلم المستمر دون إعادة البدء من الصفر.

جهاز صغير مستوحى من الخلايا الحية
استُلهم العمل من طريقة استعمال الخلايا الحية لاختلاف تركيزات الأيونات عبر أغشيتها كمناظر طاقة طويلة الأمد للإشارة والذاكرة. بدل محاولة تقليد كل التفاصيل البيولوجية، ركّز الباحثون على إعادة إنتاج خاصية رئيسية واحدة: تدرج مدمج يتغير ببطء مع الزمن. بنوا جهازًا إلكترونيًا على شكل ساندويتش، يُسمى مقاومًا متغيرًا من الدرجة الثانية، مكوَّنًا من أفلام رقيقة مكدّسة على قطب شفاف. بإدخال طبقة جزيئية خاصة من زنك-بورفيرين ثم ترسيب طبقة أكسيد الألومنيوم بعناية فوقها، أنشأوا تدرج تركيز أكسجين مستقر داخل الجهاز. يعمل هذا التدرج الداخلي بطريقة مشابهة لاختلاف الداخل والخارج عبر غشاء الخلية، مخزّنًا تاريخ النشاط الكهربائي السابق.
تغيّر بطيء وقابل للتحكم بدل التبديل المفاجئ
تتحوّل العديد من المقاومات المتغيرة الحالية فجأة بين حالات، وهو أمر جيد للذاكرة الرقمية لكنه سيئ في تمثيل التغير التدريجي عبر الزمن. في الجهاز الجديد، تنجرف أيونات الأكسجين وتنتشر ببطء على طول التدرج المدمج، مخلّفة موصلية كهربائية تتطور برفق ويمكن أن تستمر وتسترخي لأكثر من 100 ثانية. بتطبيق نبضات كهربائية قصيرة بقوى مختلفة من اتجاه واحد، تمكن الفريق من دفع الأيونات أكثر ضد التدرج أو السماح لها بالانتشار عائدة، مكيّفين الموصلية بدقة بدلًا من قلبها تشغيلًا/إيقافًا. سمح هذا السلوك، المعروف بالديناميكيات من الدرجة الثانية، للجهاز بخلق نحو 40 مستوى وسيط طويل العمر—حالات «شبه غير متطايرة» ليست ثابتة نهائيًا، لكنها تبقى مستقرة لفترة كافية لتكون مفيدة في التعلم.

كيف يعيد الجهاز تشكيل التعلم عمليًا
لإظهار أهمية هذا السلوك البطيء المدفوع بالتدرج، ربط المؤلفون الجهاز مباشرة بقاعدة تعلم شائعة تُستخدم في التعلّم التعزيزي، حيث يستكشف وكيل عالمًا مرارًا ويحدّث مقدار ثقته بكل إجراء. في هذه الخوارزميات، يتحكم معلم واحد—معدل التعلم—بسرعة استبدال الخبرة السابقة بمعلومات جديدة. بدل اختيار هذا المعدل يدويًا، ربطوه بتغيرات الموصلية الزمنية لمقاومهم المتغير. بعد نبضة كهربائية قوية، تتغير موصلية الجهاز بسرعة في البداية؛ ثم تستقر في تعديلات أبطأ وأصغر لاحقًا. ترجمة هذا التباطؤ الطبيعي إلى قاعدة التعلم تعني أن الوكيل يبدأ استكشافه بجرأة ثم يثبت استراتيجيته تدريجيًا، تمامًا كسلوك الحيوان الذي يجرب أولًا ثم يصقل عاداته لاحقًا.
التفوق على التدريب التقليدي في عوالم متغيرة
اختبر الباحثون جدول التعلم المستوحى من الجهاز على مهام محاكاة للملاحة حيث يجب على مركبة ذاتية إيجاد مسار جيد تحت تغطية اتصالات. في عالم ثابت، خفّض معدل التعلم المدفوع بالمقاوم المتغير عدد تكرارات التدريب اللازمة للوصول إلى حل جيد بنحو 70 في المئة مقارنة بالجداول الثابتة أو المعدلة يدويًا، مع تقليل التذبذبات غير المستقرة والخيارات المحلية السيئة. ثم جعلوا المشكلة أصعب بتوسيع الخرائط وتغيير الظروف على مراحل متعددة، مقلدين عالمًا يزداد تعقيدًا مع الزمن. حتى هناك، خفّض نمط التعلم المستمد من الجهاز إجمالي عدد حلقات التدريب بأكثر من ثلث مقارنة بالخطوط الزمنية الخطية القياسية، متكيفًا بسلاسة مع تكاثر المهمة.
ماذا يعني هذا لآلات شبيهة بالدماغ في المستقبل
للقارئ العام، الرسالة الأساسية هي أن الفريق حوّل خدعة مادية مجهرية—تثبيت تدرج أكسجين لطيف—إلى طريقة قوية للتحكم في كيفية تعلم الآلات عبر الزمن. بدل الاعتماد على إعدادات برمجية مضبوطة يدويًا بعناية، ينبثق سلوك التعلم طبيعيًا من فيزياء الجهاز الداخلية البطيئة. يقترح هذا مستقبلًا حيث لا تكتفي الأجهزة العصبية المحاكاة بتخزين أرقام، بل تُجسّد قواعد التعلم في بنيتها المادية، ما يصنع أنظمة اصطناعية قادرة على التكيف المستمر مع حالات جديدة مع استهلاك طاقة أقل وتدخل بشري أقل في الضبط.
الاستشهاد: Ming, J., Wang, R., Fu, J. et al. Intrinsic gradient oxygen-driven second-order memristors for continual reinforcement learning. Nat Commun 17, 3367 (2026). https://doi.org/10.1038/s41467-026-70014-0
الكلمات المفتاحية: مقاوم متغير, أجهزة عصبية محاكاة, التعلّم التعزيزي, تدرج أيون الأكسجين, التعلّم المستمر