Clear Sky Science · ar

دور القدرة التشخيصية في تقدير كفاءة الروبوت

· العودة إلى الفهرس

لماذا تهم زلات الروبوتات الجميع

تنتقل الروبوتات وأنظمة الذكاء الاصطناعي بسرعة من المختبرات إلى المصانع والمستشفيات وشوارعنا. ومع تزايد اعتمادنا عليها، يبرز سؤال حاسم: كيف يقرر الناس ما إذا كان الروبوت كفءًا حقًا؟ تستكشف هذه الورقة كيف نحكم على روبوت يؤدي عادةً أداءً جيدًا لكنه أحيانًا يرتكب خطأً مفاجئًا — أو ينجز نجاحًا غير متوقع. تساعد النتائج في توضيح لماذا قد تختلف «الحدس» لدينا تجاه الآلات عما نقوله علنًا، ولماذا يمكن لخطأ واحد أن يُستهان به أو أن يغير ثقتنا بشكل دائم.

طريقتان يحكم بهما عقلنا على الآلات

يفرق علماء النفس بين نوعين من الانطباعات. الانطباعات الصريحة هي الأحكام التي يمكننا الإبلاغ عنها مباشرة عند السؤال، مثل تقييم روبوت على مقياس كفاءة من 1 إلى 7. الانطباعات الضمنية أكثر تلقائية، وتتجلى في الاستجابات السريعة التي يقدمها الناس دون تركيز على التقييم. أشارت أعمال سابقة إلى أن الانطباعات الصريحة تتغير بسرعة عند رؤية سلوك جديد، بينما تكون الانطباعات الضمنية أبطأ في التغير. يسأل هذا البحث عما إذا كان هذا الفارق فعلاً ناتجًا عن أنظمة عقلية مختلفة — أم أنه يعتمد على مدى استدلالية، أو تشخيصية، السلوك الجديد بالنسبة لقدرات الروبوت الحقيقية.

Figure 1
الشكل 1.

من أرضيات المصانع إلى غرف العمليات والطُرُق السريعة

على امتداد تسع تجارب عبر الإنترنت شملت أكثر من 3700 مشارك، عرض الباحثون على الناس روبوتات مختلفة تعمل في بيئات واقعية: روبوت صناعي يتنقل في مستودع مزدحم، روبوت جراحي يتتبع مسارات دقيقة، وسيارة ذاتية القيادة تتفاعل مع عقبات في الطريق. أحيانًا كان الروبوت ماهرًا باستمرار أو أخرقًا باستمرار. في حالات أخرى، كان في الغالب كفءًا لكنه ارتكب خطأً واضحًا واحدًا، أو كان في الغالب غير كفء لكنه حقق نجاحًا بارزًا واحدًا. بعد مشاهدة مقاطع قصيرة لهذه الأداءات، قيس انطباع المشاركين بطريقتين: أسئلة مباشرة للتقرير الذاتي ومهام غير مباشرة التقطت ردودًا سريعة وتلقائية.

عندما يهيمن أداء غريب واحد

في هذه السيناريوهات الواقعية، تابعت تقييمات الناس الصريحة للروبوتات كلًا من نمط الأداء العام والتجربة النادرة «الغريبة». فقد يؤدي خطأ واحد وحيد بين العديد من النجاحات إلى خفض التقييمات الصريحة بشكل ملحوظ، ويمكن أن يعزز نجاح وحيد بين العديد من الإخفاقات تلك التقييمات. أما الانطباعات الضمنية، فكانت تحكي قصة مختلفة. فقد استجابت بقوة للسلوك النموذجي للروبوت — سواء كان عادةً كفءًا أم لا — لكنها تجاهلت إلى حد كبير التجربة الغريبة الوحيدة. ظلت هذه الفجوة موجودة حتى عندما أعاد الباحثون تصميم مقاييسهم بعناية بحيث بدت المهام «الصريحة» و«الضمنية» متشابهة قدر الإمكان، وتختلف أساسًا فيما إذا طُلب من المشاركين الحكم عن قصد على الروبوت.

ما الذي يجعل خطأ الروبوت ذا دلالة حقيقية

ثم اختبر الفريق فكرة مركزية: أن قوة حدث غريب تعتمد على مدى تشخيصيته — أي ما إذا كان الناس يعتقدون أنه يكشف فعلاً شيئًا دائمًا عن الروبوت. في دراسات لاحقة، شاهد المشاركون أولاً روبوتًا يؤدي عدة تجارب خالية من العيوب، ثم شاهدوا لاحقًا فشلًا أو أكثر. عندما عُرضت الفشلات اللاحقة على أنها مهمة أو حديثة الاختبار، أو عندما تراكمت عدة فشلات لتساوي مقدار النجاحات السابقة، تغيرت كل من الانطباعات الصريحة والضمنية. والأهم من ذلك، أنه في ظل هذه الظروف ذات القوة التشخيصية العالية كان حتى الخطأ الفردي كافيًا لتحريك الانطباعات التلقائية الضمنية. أما عندما وُصف نفس النوع من الزلة على أنه قديم أو غير مهم أو طارئ لمرة واحدة، فقد بقيت الانطباعات الضمنية بالكاد متأثرة، رغم أن التقييمات الصريحة استمرت في التغيير.

Figure 2
الشكل 2.

لماذا يهم هذا في ثقتنا اليومية بالذكاء الاصطناعي

تشير النتائج مجتمعة إلى أن انطباعاتنا السريعة التلقائية عن كفاءة الروبوت ليست غافلة عن المعلومات الجديدة، لكنها تطلب أدلة أقوى أو أكثر وضوحًا ذات مغزى قبل أن تتغير. بينما تكون تقييماتنا المنطوقة، بالمقابل، متجاوبة للغاية حتى مع الأحداث الضعيفة أو الغامضة، جزئيًا لأننا نشعر بضغط لاستخدام أي معلومات متاحة عندما يُطلب منا حكم. بالنسبة للمصممين والمهندسين وواضعي السياسات، فهذا يعني أن إدارة الثقة في الروبوتات ليست مجرد مسألة تقليل الأخطاء، بل تتعلق أيضًا بكيفية تأطير هذه الأخطاء وفهمها. ففشل واحد ذا دلالة واضحة — مثل أن تتوقف سيارة عن عدم التوقف عندما يتوجب عليها ذلك بوضوح — يمكن أن يعيد تشكيل كلًا من حدسنا وآرائنا المصرح بها، مع عواقب مباشرة على استعدادنا لتبني والاعتماد على الآلات الذكية.

الاستشهاد: Surdel, N., Ferguson, M.J. The role of diagnosticity in judging robot competence. Sci Rep 16, 7578 (2026). https://doi.org/10.1038/s41598-026-35375-y

الكلمات المفتاحية: كفاءة الروبوت, التفاعل بين الإنسان والروبوت, التحيز الضمني, الثقة في الذكاء الاصطناعي, معلومات تشخيصية