Clear Sky Science · he
לא־וודאות והיסטוריות תגמול משפיעות באופן שונה על החלטות אחרי ניצחונות והפסדים
למה ניצחונות והפסדים אינם מלמדים אותנו באותה מידה
כל יום אנו מקבלים החלטות המבוססות על ניצחונות והפסדים בעבר — מבחירת מניה ועד בחירת מסלול לעבודה. ובכל זאת, בני אדם וחיות נוטים ללמוד יותר מהצלחה מאשר מכישלון. מאמר זה בוחן מדוע חוסר האיזון הזה אינו סתם תכונה מקרית, אלא אסטרטגיה אדפטיבית המעוצבת על ידי האופן שבו המוחות שלנו עוקבים אחר היסטוריית תגמול וחוסר־וודאות. באמצעות מחקר על חולדות בסביבה משתנה וחלקית בלתי־ניתנת לחיזוי, החוקרים מגלים כללים נסתרות שקובעות מתי ניצחונות חשובים יותר מהפסדים — וכיצד כללים אלה שונים בין זכרים לנקבות.

עולם משתנה לחולדות צמאות
כדי לחקור את הכללים הללו, הצוות אילף חולדות שהוגבלו במים במשימה דינמית של בחירה. בכל ניסיון החולדות היו מפעילות סיבוב ואז בוחרות בין שני לבטים. לבט אחד היה בעל סבירות גבוהה יותר לספק טיפת מים מתוקה, אך איזה לבט היה "טוב יותר" וכמה טוב היה זה השתנה לאורך הבלוקים במהלך המושב. חלק מהבלוקים הפכו את הלטב ה"טוב" לברור מאוד (צד אחד שילם רוב הזמן, האחר כמעט אף פעם), בעוד שבבלוקים אחרים המצב היה מבלבל יותר, עם סיכויים קרובים או שווים לתגמול בשני הלבטים. סידור משתנה זה מדמה את החיים האמיתיים, שבהם מה שעבד אתמול עשוי שלא לעבוד היום.
להיצמד למנצחים, להתעלם מחלק מההפסדים
במאות מושבים החולדות נטו לחזור על בחירה לאחר ניצחון ("להישאר אחרי ניצחון") בתדירות גבוהה יותר מאשר להחליף אחרי הפסד ("להזיז אחרי הפסד"). הממצא הזה אישר נטייה חזקה ללמוד מהצלחה. התבנית הייתה ברורה במיוחד ברגע שלחולדות הייתה אפשרות, בתוך בלוק, להבין איזה לבט בדרך כלל טוב יותר. בניסיונות המאוחרים הללו הן לא רק נשארו יותר אחרי ניצחונות, אלא גם היו פחות נוטות לוותר על הלבט הטוב לאחר הפסד נדיר. אסטרטגיה זו עזרה להן להמשיך לנצל את האפשרות הרווחית במקום להטעות על ידי תוצאה שלילית מזדמנת שיכולה להתרחש אף על בחירה טובה. זכרים הראו הטיה זו בחוזקה רבה יותר מאשר נקבות: הם היו יותר נוטים להישאר אחרי ניצחונות ופחות נוטים להזיז אחרי הפסדים.
איתותים נסתרים: חוסר־וודאות והיסטוריית תגמול
כדי להבין את החישובים הבלתי נראים שעומדים מאחורי ההתנהגות הזו, המחברים השתמשו במודלים של למידת חיזוקים — אלגוריתמים שמעדכנים ציפיות על סמך משוב. הם התרכזו בשני אותות פנימיים. האחד היה מדד "היסטוריית חוסר־וודאות": ממוצע של רמות ההפתעה האחרונות, שצורך לתאר עד כמה התוצאות היו בלתי צפויות. כאשר מספר זה היה גבוה, הסביבה הייתה באופן אפקטיבי ערפילית יותר. השני היה "מצב תגמול גלובלי", סיכום משוכל של עד כמה הסביבה האחרונה הייתה עשירה או דלה בתגמולים. יחד, אותות אלה אפשרו לחולדות לאמוד גם עד כמה העולם רועש וגם עד כמה הדברים הלכו טוב לאחרונה, ולהתאים את המשקל שהן נותנות לניצחון או להפסד העדכני.

מתי חוסר־הוודאות ועושר מעצבים בחירות
שני האותות הפנימיים השפיעו על ההתנהגות באופן מובחן ולעתים באופן ספציפי למין. החולדות היו נוטות יותר להישאר אחרי ניצחון ופחות לוותר על הלבט הטוב כאשר חוסר־הוודאות היה נמוך — כלומר, כאשר דפוסי הסביבה היו ברורים יותר. בתנאי חוסר־וודאות גבוה הן נטו יותר להחליף רחוק מלבט טוב אחרי הפסד, מה שמעיד שתנאים מבלבלים יכולים לעורר זהירות גדולה יותר. לעומת זאת, מצב תגמול גלובלי גבוה, שמשקף רצף טוב של תוצאות, עודד את החולדות להמשיך להישאר אחרי ניצחונות והפחית את הנטייה שלהן להחליף אחרי הפסדים, אפילו כשהסביבה הייתה מעט רועשת. החלטות מבוססות ניצחון אצל זכרים הושפעו במיוחד מההיסטוריית חוסר־הוודאות שלהם, בעוד שנקבות הסתמכו בצורה יציבה יותר על מצב התגמול הכולל.
מה זה אומר עבור החלטות יומיומיות
לאדם מן השורה, המסר המרכזי הוא ש"ללמוד יותר מניצחונות מאשר מהפסדים" אינו סתם אופטימיות מופרזת. המחקר מצביע על כך שחולדות — ובסבירות גבוהה גם בני אדם — מכווננות דינמית עד כמה הן מקשיבות לניצחונות ולהפסדים על סמך כמה צפויה וכמה מתגמלת נראית להן הסביבה לאחרונה. כשהחוקים נראים ברורים והתגמולים שופעים, זה עשוי להיות חכם לסמוך על ניצחונות ולהפחית את המשקל של כישלונות מזדמנים. כשדברים מרגישים כאוטיים או דלים, לתת משקל גדול יותר להפסדים עשוי לסייע להימנע מבחירות רעות. העבודה גם חושפת שזכרים ונקבות יכולים לפעול על־פי אותם כללי משימה באמצעות מאזן פנימי שונה של חוסר־וודאות והיסטוריית תגמול, תובנה שעשויה לעזור להסביר הבדלים בין המינים בפגיעות להפרעות כמו התמכרות או דיכאון, שבהן הלמידה מתגמול ועונש משתבשת.
ציטוט: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3
מילות מפתח: למידת חיזוקים, קבלת החלטות, חוסר־וודאות, היסטוריית תגמול, הבדלים בין המינים