Clear Sky Science · ar

نماذج معرفية تُسهِم في استنتاج الدوافع الخفية في الوقت الحقيقي

2026-01-28 · العودة إلى الفهرس

لماذا يهم تخمين الأهداف الخفية

كل يوم، تقرأ بصمت نوايا من حولك — سواء كان السائق على وشك الانحراف إلى مسارك، أو راكب الدراجة سيتوقف، أو زميل في العمل يحاول المساعدة أم التنافس. تعتمد هذه الأحكام الفورية على تفسير الدوافع الخفية من الحركات الظاهرة. يمكن للذكاء الاصطناعي اليوم أن يكون دقيقًا جدًا في التنبؤ، لكنه غالبًا ما يعمل كـ «صندوق أسود» لا يشرح لماذا اتخذ قرارًا معينًا. تسأل هذه الدراسة ما إذا كانت نماذج نفسية للسلوك البشري يمكن أن تمنح الذكاء الاصطناعي قدرة أشبه بالبشر على إدراك دوافع الآخرين، مما يجعله أسرع وأكثر دقة وأسهل في الثقة.

لعبة بسيطة للمطاردة والتفادي

لاستكشاف ذلك، بنى الباحثون لعبة فيديو مبسطة. في كل جولة مدتها 10 ثوانٍ، قاد لاعب بشري «سفينة» مثلثة باستخدام عصا تحكم بينما تحركت سفينة يتحكم بها الحاسوب وفق أحد الأنماط العديدة. تم تعيين هدف خفي للاعب البشري أحد ثلاثة: الهجوم (الاصطدام بالسفينة الأخرى)، التجنب (البقاء بعيدًا)، أو التفتيش (البقاء قريبًا دون الاصطدام). كانت سفينة الحاسوب قد تتصرف باندفاع، أو خجل، أو فضول، أو دفاعية، أو تتجول فحسب. خلقت هذه التركيبات مواقف تتماشى فيها حركات السفن أو تتعارض — على سبيل المثال، إنسان مهاجم يطارد حاسوب خجول يحاول الفرار.

قياس مدى قدرة البشر على قراءة الأهداف الخفية

كانت الخطوة الأولى معرفة مدى قدرة الناس أنفسهم على قراءة النوايا من الحركة. أخذ الفريق لقطات لعب من أفضل ثمانية طيارين وحوّل كل جولة إلى مقطع فيديو قصير. شاهد متطوعون جدد هذه المقاطع واضطروا لتخمين هدف اللاعب البشري — هجوم، تجنُّب، أو تفتيش — بعد رؤية ثانية واحدة أو 4 أو 7 أو 10 ثوانٍ فقط من الحركة. عبر مجموعات متعددة، بما في ذلك مشاركين مع تشخيص توحد ومن دونه، حدد الناس الهدف بشكل صحيح في نحو ثلثي المرات. ارتفعت الدقة مع رؤية مزيد من زمن الجولة، وكان الأداء متشابهًا عبر المجموعات، مما وفر معيارًا بشريًا قويًا للمقارنة.

مخطط نفسي للحركة

بدلًا من تزويد شبكة عصبية ببيانات فيديو خام، بنى المؤلفون نموذجًا معرفيًا لالتقاط القوى التي قد تقود حركة الشخص. يفترض نموذجهم «السعي العالمي-المحلي نحو الهدف» (GLOP) أن اللاعب يوازن بين عدة عوامل في آن واحد: الحفاظ على مسافة مفضلة من الخصم (القرب الشديد يشعر بالخطر، والبعد يفوّت الفرص)، والبقاء في مواقع جيدة على الشاشة بدلاً من الحبس في زاوية، ومطابقة أو توقع وتيرة واتجاه السفينة الأخرى. تُجمع هذه العوامل في اتجاه حركة واحد «دوافع»، مع مصطلحات إضافية لتعكس مدى سلاسة الحركة وكمية العشوائية في التحكم.

تعليم الذكاء الاصطناعي قراءة العقول من الحركة

لجعل هذا النموذج مفيدًا في الوقت الحقيقي، ربط الباحثون محاكاة لـ 100,000 جولة لعب باستخدام إعدادات مختلفة كثيرة لمُعاملات GLOP. ثم دربوا شبكة عصبية تكرارية لتأخذ تسلسلات مواقع السفن وتقدّر بسرعة المعاملات الخفية — مثل المسافة المفضلة أو مدى أهمية الموقع العام بالنسبة للشخص. استطاعت هذه الشبكة استرداد عدة معاملات رئيسية بدقة عالية من ثوانٍ قليلة فقط من الحركة. بعد ذلك، دربوا مجموعة من شبكات التصنيف لتخمين هدف اللاعب بثلاث طرق مختلفة: مباشرة من بيانات الموقع الخام، من إحصاءات موجزة بسيطة (مثل متوسط المسافة والاقتراب مقابل التجنب)، أو من معاملات النموذج المعرفي المستنتجة. أخيرًا، بنوا مُصنِّفات «تجميعية» تجمع هذه المصادر معًا.

التفوق على المعيار البشري

طابقت جميع مُصنِّفات الذكاء الاصطناعي أو تفوقت على أداء البشر، لكن طريقة تحضير المعلومات لهم كانت مهمة. الشبكات التي اعتمدت فقط على الحركة الخام أو فقط على معاملات النموذج أدّت بشكل مشابه للبشر، بحوالي 66% من الدقة. أدت المصنِّفات المزودة بإحصاءات موجزة بسيطة أداءً أفضل، وكانت أفضل النتائج من نصيب الجمع بين تلك الإحصاءات ومعاملات النموذج المعرفي، لتصل إلى نحو 72% دقة. دربت هذه الأنظمة المستنيرة بالنموذج أيضًا أسرع وبثبات أكبر من تلك التي زوِّدت بالبيانات الخام فقط. وعند تتبع الدقة لحظة بلحظة خلال كل جولة، استطاع الذكاء الاصطناعي تحديث تخمينه بشأن الهدف الخفي للاعب في أقل من وقت تحديث الشاشة، مستنتجًا النية عمليًا في الوقت الحقيقي.

ما معنى هذا للذكاء الاصطناعي في الحياة اليومية

بالنسبة لقارئ عادي، الخلاصة هي أن دمج النظرية النفسية في الذكاء الاصطناعي يمكن أن يساعد الآلات على فهم ليس فقط ما يفعله الناس، بل لماذا يفعلونه. عبر ترجمة الحركات الفوضوية إلى مجموعة صغيرة من الدوافع القابلة للتفسير — مثل مدى قرب شخص ما أو كيف يوازن بين السلامة والفرصة — يصبح النظام أكثر دقة وأسهل في الشرح. في تطبيقات مستقبلية مثل السيارات ذاتية القيادة أو فرق الإنسان والذكاء الاصطناعي، قد يساعد هذا النوع من «الواجهة المعرفية» الذكاء الاصطناعي على توقع نوايا الوكلاء الآخرين مبكرًا وبموثوقية أكبر، مما قد يمنع التصادمات وسوء الفهم ويقدّم تفسيرات ودّية للإنسان مثل «السائق الآخر على الأرجح يحاول الاندماج، وليس مجرد الانجراف.»

الاستشهاد: Fitch, A.K., Kvam, P.D. Cognitive models facilitate real-time inference of latent motives. Sci Rep 16, 6444 (2026). https://doi.org/10.1038/s41598-026-37587-8

الكلمات المفتاحية: نظرية العقل, نمذجة معرفية, استدلال النوايا, التفاعل بين الإنسان والذكاء الاصطناعي, الذكاء الاصطناعي القابل للتفسير