Clear Sky Science · ar

لتاريخا عدم اليقين والمكافأة تأثيرات مميزة على القرارات بعد الانتصارات والخسائر

· العودة إلى الفهرس

لماذا لا تُعلِّمنا الانتصارات والخسائر بالمقدار نفسه

نتخذ خيارات يومية استنادًا إلى الانتصارات والخسائر الماضية، من اختيار سهم إلى تحديد طريق الذهاب إلى العمل. ومع ذلك يشتهر كل من البشر والحيوانات بتعلّمهم أكثر من النجاح منه من الفشل. يستكشف هذا المقال لماذا هذا الاختلال ليس مجرد غلببة، بل استراتيجية تكيفية تشكلت لطريقة تتبُّع أدمغتنا لتاريخ المكافأة وعدم اليقين. من خلال دراسة الجرذان في بيئة متغيرة وشبه عشوائية، يكشف الباحثون عن قواعد مخفية تحدد متى تصبح الانتصارات أكثر أهمية من الخسائر — وكيف تختلف تلك القواعد بين الذكور والإناث.

Figure 1
Figure 1.

عالم متقلب لجرذان عطشى

لفحص هذه القواعد، درّبت المجموعة جرذانًا مقيدة بالماء على مهمة اختيار ديناميكية. في كل تجربة، يبدأ الجرذ جولة ثم يختار بين رافعتين. كانت إحدى الرافعتين أكثر احتمالًا لإيصال قطرة ماء محلاة، لكن أي رافعة كانت «الأفضل» ومدى تفوقها ظل يتغير في كتل خلال الجلسة. جعلت بعض الكتل الرافعة الأفضل واضحة جدًا (جانب واحد يكافئ معظم الوقت والآخر يكاد ألا يكافئ)، بينما كانت كتل أخرى أكثر ارتباكًا، مع احتمالات أقرب أو حتى متساوية للمكافأة على الرافعتين. هذه البنية المتغيرة باستمرار تحاكي الحياة الواقعية، حيث ما نجح بالأمس قد لا ينجح اليوم.

التمسك بالفائزين، وتجاهل بعض الخسائر

عبر مئات الجلسات، ميّلت الجرذان إلى تكرار الاختيار بعد فوز («البقاء بعد الفوز») أكثر مما كانت تغير بعد خسارة («التغيير بعد الخسارة»). أكد ذلك ميلًا قويًا نحو التعلم من النجاح. كان النمط واضحًا بشكل خاص بعد أن أُتح للجرذان وقت داخل الكتلة لمعرفة أي رافعة تكون عادة أفضل. في هذه المحاولات المتأخرة، لم تقتصر سلوكياتها على البقاء أكثر بعد الانتصارات فحسب، بل كانت أيضًا أقل احتمالًا للتخلي عن الرافعة الأفضل بعد خسارة نادرة. ساعدتهم هذه الاستراتيجية في الاستمرار باستغلال الخيار الأكثر مردودًا بدلًا من أن يضلّهم نتيجة سيئة عرضية يمكن أن تحدث حتى مع خيار جيد. أظهر الذكور هذا الانحياز بقوة أكبر من الإناث: كانوا أكثر ميلاً للبقاء بعد الانتصارات وأقل ميلاً للتبديل بعد الخسائر.

إشارات مخفية: تاريخ عدم اليقين وتاريخ المكافأة

لفهم الحسابات غير المرئية وراء هذا السلوك، استخدم المؤلفون نماذج التعلم المعزز — خوارزميات حاسوبية تحدّث التوقعات استنادًا إلى التغذية الراجعة. ركزوا على إشارتين داخليتين. الأولى كانت مقياس «تاريخ عدم اليقين»: متوسط لمستويات المفاجأة الأخيرة، يلتقط مدى عدم قابلية النتائج للتنبؤ. عندما كان هذا الرقم مرتفعًا، كان العالم عمليًا أكثر غموضًا. الثانية كانت «حالة المكافأة العامة»، موجز مطوَّق يعكس مدى غني أو فقير الشعور العام بالنتائج الأخيرة. معًا، سمحت هاتان الإشارتان للجرذان بتقدير كل من ضوضاء البيئة ومدى نجاح الأمور مؤخرًا، وتكييف مقدار الوزن الذي يمنحونه للفوز أو الخسارة الأخيرة.

Figure 2
Figure 2.

عندما تشكّل اللايقين والغنى الاختيارات

أثّرت الإشارتان الداخليتان على السلوك بطرق مميزة وأحيانًا خاصة بالنوع الجنسي. كانت الجرذان أكثر ميلاً للبقاء بعد فوز وأقل احتمالًا للتخلي عن الرافعة الأفضل عندما كان عدم اليقين منخفضًا — أي عندما كان نمط البيئة أوضح. في ظل عدم يقين مرتفع، كانوا أكثر ميلاً للتبديل بعيدًا عن رافعة جيدة بعد خسارة، ما يشير إلى أن الظروف المربكة قد تُثير سلوكًا أكثر حذرًا. في المقابل، شجعت حالة مكافأة عامة مرتفعة، التي تعكس سلسلة جيدة عمومًا من النتائج، الجرذان على الاستمرار في البقاء بعد الانتصارات وقللت ميلها للتبديل بعد الخسائر، حتى عندما كانت البيئة متقلبة إلى حد ما. كانت قرارات الذكور المعتمدة على الفوز متشكّلة بشكل خاص من تاريخ عدم اليقين لديهم، بينما اعتمدت الإناث بشكل أكثر اتساقًا على حالة المكافأة العامة.

ما يعنيه هذا لقراراتنا اليومية

للقارئ غير المتخصص، الرسالة الرئيسية هي أن «التعلم من الانتصارات أكثر من الخسائر» ليس مجرد تفاؤل مفرط. تُظهر الدراسة أن الجرذان — وعلى الأرجح البشر — يضبطون بشكل ديناميكي مقدار استجابتهم للانتصارات والخسائر استنادًا إلى مدى قابلية التنبؤ ووفرة المكافآت مؤخرًا. عندما تبدو القواعد واضحة والمكافآت وافرة، قد يكون من الحكمة الثقة بالانتصارات وتجاهل الفشل العرضي. عندما يشعر المرء بأن الأمور فوضوية أو شحيحة، قد يساعد إعطاء وزن أكبر للخسائر على تجنّب الخيارات السيئة. يكشف العمل أيضًا أن الذكور والإناث قد يتبعان نفس قواعد المهمة مستخدمين توازنات داخلية مختلفة بعض الشيء بين تاريخ عدم اليقين وتاريخ المكافأة، وهي بصيرة قد تساعد في تفسير الفروق بين الجنسين في القابلية لاضطرابات مثل الإدمان أو الاكتئاب، حيث يختل تعلم المكافأة والعقاب.

الاستشهاد: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3

الكلمات المفتاحية: التعلم المعزز, اتخاذ القرار, عدم اليقين, تاريخ المكافأة, الفروق بين الجنسين