Clear Sky Science · ar
تحقيق رؤية أقرب إلى دماغ الإنسان عبر مواءمة التمثيلات مع إشارات EEG البشرية
لماذا يهم هذا البحث
يمكن للذكاء الاصطناعي الحديث التعرف على الأشياء في الصور بدقة تقارب دقة الإنسان، لكنه لا «يرى» العالم بنفس طريقة أدمغتنا. تقدم هذه الدراسة طريقة جديدة لضبط أنظمة الرؤية الحاسوبية باستخدام إشارات دماغية مسجلة من متطوعين، مما يقرب الذكاء الاصطناعي خطوة نحو فهم بصري أشبه بالبشر. عبر تشكيل نموذج رؤية مباشرةً بناءً على نشاط الدماغ البشري، توحي الدراسة بإمكانية ظهور ذكاء اصطناعي لا يقتصر على القوة فحسب، بل يكون منظماً بطريقة أقرب إلى عقولنا.

تعليم الآلات بموجات الدماغ
يركز الباحثون على فكرة بسيطة وجريئة: بدلاً من تدريب نماذج الرؤية فقط على الصور والتسميات، لماذا لا نُظهر لها أيضاً كيف يستجيب دماغ الإنسان لتلك الصور؟ يستخدمون تخطيط أمواج الدماغ الكهربائي (EEG)، الذي يقيس تغيّرات ضئيلة في الجهد على فروة الرأس أثناء مشاهدة الأشخاص للصور. EEG غير تدخلي نسبياً، منخفض التكلفة، ويمكن جمعه بسرعة عبر العديد من التجارب. من عشرة متطوعين، استخدمت الفريق مجموعة بيانات مفتوحة كبيرة حيث شاهد كل شخص عشرات الآلاف من صور الأشياء الطبيعية بينما سُجلت إشارات EEG خلال أول جزءين من العُشر من الثانية بعد ظهور كل صورة.
بناء شبكة رؤية متوافقة مع الدماغ
انطلاقاً من نموذج رؤية عميق موجود يُدعى CORnet-S، أضاف الباحثون وحدة إضافية «صورة-إلى-دماغ». عندما تدخل صورة إلى الشبكة، يقوم النموذج الآن بمهمتين في آن واحد: يخمن الكائن الموجود ويحاول التنبؤ بنمط EEG الذي أظهره إنسان حقيقي لنفس الصورة. لتحقيق ذلك، تُجمَع الإشارات من عدة طبقات داخلية في الشبكة إلى وحدة EEG، التي تتعلم توليد سلسلة زمنية قصيرة تُطابِق بيانات الإنسان. أثناء التدريب، يكافأ النموذج سواء على التعرف الصحيح على الأشياء أو على إنتاج نشاط يشبه EEG، مما يدفع ميزاته الداخلية لتشبه تلك الموجودة في النظام البصري البشري.
أقرب إلى نشاط الدماغ عبر طرق متعددة
بعد تدريب عشرة «ReAlnets» من هذا النوع (واحد لكل مشارك)، تساءل الفريق عما إذا كانت هذه النماذج قد أصبحت فعلاً أكثر شبهاً بالدماغ. قارنوا نمط العلاقات بين الصور داخل النموذج بنمط المشاهد في EEG البشري، مستخدمين تقنية تُسمى تحليل التماثل التمثيلي (representational similarity analysis). عبر جميع الطبقات الرئيسية ونقاط الزمن بين 50 و200 مللي ثانية، كانت ReAlnets متشابهة مع EEG البشري باستمرار أكثر من CORnet-S الأصلي ونماذج معيارية أخرى، مع زيادات قصوى تصل إلى نحو 6% وتحسينات نسبية تصل إلى 40%. والأهم أن هذا التعزيز ظل قائماً حتى لفئات كائنات جديدة لم تُستخدم أثناء التدريب، مما يُظهر أن المواءمة تُعمَم خارج مجموعة التدريب.

الوصول إلى صور الدماغ والسلوك
سؤال أساسي هو ما إذا كانت النماذج تعلمت مجرد خصوصيات EEG أم التقطت شيئاً أكثر عمومية عن الرؤية البشرية. لاختبار ذلك، لجأ المؤلفون إلى مجموعة بيانات تصوير دماغي منفصلة، حيث شاهد متطوعون مختلفون صوراً طبيعية وأشكالاً مجردة وحروفاً داخل جهاز التصوير بالرنين المغناطيسي (MRI). رغم أن ReAlnets لم يرَ هذه البيانات من قبل، طابقت أنماطها الداخلية إشارات من عدة مناطق بصرية في الدماغ بشكل أوثق من النموذج الأصلي. علاوة على ذلك، كان مقدار التحسن في EEG وMRI مرتبطاً بقوة عبر النماذج، ما يوحي بتعزيز تمثيل جوهري مشترك. قيّم الباحثون أيضاً تكرار الأخطاء بين النماذج والبشر في مهام تمييز الأشياء الصعبة؛ وهناك أيضاً توافق أكبر بين ReAlnets والسلوك البشري مقارنةً بالنماذج الأساسية.
رؤية شبيهة بالدماغ، مخصصة وعامة
بما أن كل ReAlnet تم ضبطه على EEG شخص واحد، استطاع المؤلفون فحص الاختلافات الفردية. وجدوا أن النماذج المخصصة لكل شخص تباعدت عن بعضها أكثر في الطبقات الأعمق، مما يعكس كيف تتزايد الاختلافات بين الأشخاص من المناطق البصرية المبكرة إلى العليا. ومع ذلك، ظلت نماذج كل شخص تعمم إلى EEG لأشخاص آخرين أفضل من خط الأساس غير الممواء، مما يبين أنها التقطت بنية مشتركة وخاصة بالمشارك في آن واحد. وسّع الفريق أيضاً إطار العمل إلى بنية مختلفة، ResNet18، ورأوا مجدداً تحسناً في المواءمة مع EEG وMRI، وبدرجة أقل مع السلوك، ما يشير إلى أن المنهج مرن ولا يقتصر على تصميم نموذج واحد.
ما الذي يعنيه هذا لفهمنا اليومي
لغير المتخصصين، الرسالة الأساسية هي أن من الممكن الآن ضبط خوارزميات الرؤية مباشرةً باستخدام تسجيلات غير تدخلية من دماغ الإنسان. لا تقتصر ReAlnets الناتجة على تمييز الأشياء؛ بل تنظم المعلومات بطرق تشبه مساراتنا البصرية بشكل أوثق عبر إشارات كهربائية، ومسح MRI، وحتى أنماط الأخطاء في مهام التعرف. ورغم أن التحسينات متواضعة ولا تزال هناك تحديات تقنية كثيرة، يقدم هذا العمل خطوة ملموسة نحو أنظمة ذكاء اصطناعي تُشكل أعمالها الداخلية على نحو متأثر بالدماغ البشري نفسه، مما قد يؤدي مستقبلاً إلى تقنيات أكثر متانة وقابلية للفهم ومخصصة لكل فرد.
الاستشهاد: Lu, Z., Wang, Y. & Golomb, J.D. Achieving more human brain-like vision via human EEG representational alignment. Commun Biol 9, 463 (2026). https://doi.org/10.1038/s42003-026-09685-w
الكلمات المفتاحية: ذكاء اصطناعي موافق للدماغ, رؤية EEG, تمييز الأشياء, عصبية حاسوبية, إدراك شبيه بالإنسان