Clear Sky Science · he

למידת חיזוק עמוקה מושפעת מהתנהגות לניהול תיק השקעות עם סלידה מהפסד וביטחון-יתר

· חזרה לאינדקס

מדוע רגשותינו חשובים בהשקעות ממוחשבות

רוב האנשים יודעים שפחד וביטחון-יתר יכולים להשפיע על בחירות ההשקעה שלהם, אך יש נטייה להניח שמערכות מסחר ממוחשבות פועלות באופן רציונלי לחלוטין. המחקר הזה מאתגר את ההנחה בכך שמראה שגם מערכות אוטומטיות יכולות להרוויח מתכונות "בדמות אדם". על ידי שילוב מדוד של סלידה מהפסד (דחייה של הפסדים) וביטחון-יתר במערכת מסחר מבוססת בינה מלאכותית מודרנית, המחברים מגלים כי תיקי השקעות יכולים להיות עמידים יותר בקריסות ויעילים יותר בתקופות שגשוג — הן במטבעות קריפטו והן במניות כחולות-ציפורן.

Figure 1
Figure 1.

להלמד רובוטים מסחריים פחד ועוז

החוקרים מתחילים מענף חזק של בינה מלאכותית שנקרא למידת חיזוק עמוקה, שבו סוכן תוכנה לומד בניסיון וטעייה כיצד לאזן מחדש תיק לאורך זמן. בגרסאות הסטנדרטיות, הסוכן מתנהג כמו משקיע רציונלי לפי הספר: הוא בוחן מחירים ואינדיקטורים ובוחר משקולות תיק שהוא מעריך שיהיו משתלמות בטווח הארוך. כאן, אותו סוכן ניטרלי עדיין קיים, אך הוא עטוף בשכבת התנהגות המדמה שתי נטיות משקיעים מתועדות היטב: סלידה מהפסד (תגובה חזקה יותר להפסדים מאשר לרווחים שווים) וביטחון-יתר (מתן אמון מופרז בתחזיותיו העצמיות). במקום לשנות מה לקנות או למכור, כללי ההתנהגות האלה משנים כמה גדולה כל פוזיציה צריכה להיות לאחר שהסוכן הניטרלי בחר את הכיוון.

כיצד חגורת הבטיחות ההתנהגותית והמטעין פועלים

במוד הסולד מהפסד, המערכת נותנת תשומת לב מיוחדת להפסדים בלתי ממומשים בכל נכס. כאשר החזקה יורדת מעבר לסף שקבעו מראש, המסגרת מקטינה אוטומטית את הסיכון הכולל ומעבירה חלק מהתיק למזומן, תוך הטיה מתונה לעבר נכסים שקיבלועוטים, בהתאם לאופן שבו משקיעים רבים מתנהגים. בניגוד לכך, במצב הביטחון-יתר, רווחים חזקים מפעילים הגדלת גודל הפוזיציות ואפילו שימוש במינוף, רכיבה אגרסיבית יותר על מגמות ולעתים "הכפלה" לאחר נפילות חזקות אם המערכת צופה התאוששות. חשוב: בלב המערכת עומד ליבת למידת החיזוק שמחליטה אילו נכסים להחזיק; המודול ההתנהגותי רק מכוונן את החשיפה מעלה או מטה סביב אותו קו בסיס.

לאפשר למצב רוח השוק לבחור את ההתנהגות

כדי להחליט מתי להיות זהירים ומתי נועזים, המחברים מחברים מנוע תחזית נפרד שנקרא TimesNet, מודל עמוק שנועד לחשוף תבניות חוזרות בסדרות זמן. TimesNet בוחן נתוני שוק אחרונים ומנבא את התשואה הכוללת של היום הבא. אם הוא צפוי לעלייה חזקה, מפעילים את הסוכן הביטחון-יתר; אם הוא צופה ירידה, הסוכן הסולד מהפסד נכנס לפעולה; וכאשר התחזית מתונה, הסוכן הניטרלי נשאר בשליטה. ממיר המשטר הזה מאומן אך ורק על נתונים עבריים באופן אד-והליכה קדימה (walk-forward) כדי להימנע מ'הצצה' אל העתיד, וניתן להחליפו במנבא אחר ללא שינוי בליבת ההתנהגות.

Figure 2
Figure 2.

בחינת המערכת שמודעת להתנהגות

הצוות מעריך את מסגרת Behavioral Bias–Aware Portfolio Trading (BBAPT) בשני זירות שונות מאוד: סל של 20 נכסים במטבעות קריפטו בתקופה 2018–2024, והרכב משתנה של מניות מדאוג׳ון ג'ונס מ-2008 עד 2024. בקריפטו, שבו תנודות קיצוניות נפוצות, הסולידותו של מוד הסלידה מהפסד בולטת בשווקים תנודתיים וטווחיים בכך שהיא מצמצמת חשיפה ומגבילה ירידות עמוקות, בעוד שביטחון-היתר מצטיין במהלך שווקים שוריים חזקים על ידי הגברת הפוזיציות המנצחות. לאורך כל התקופה, מערכת BBAPT המשולבת — המשתמשת ב-TimesNet כדי לבחור בין מצבים ניטרליים, סולדים מהפסד ובטחון-יתר — מספקת ביצועים מותאמי סיכון גבוהים יותר בהשוואה לתיקים קלאסיים על פי מרקוביץ', לאסטרטגיות משקל שווה פשוטות ולסוכני למידת חיזוק ללא התאמות התנהגותיות.

תוצאות שמחזיקות במבחן בשווקי מניות בוגרים

בניסויים ארוכי-הטווח בדאו ג'ונס, שכוללים את המשבר הפיננסי של 2008, קריסת COVID-19 והזעזועים האינפלציוניים של 2022, הדפוסים חוזרים על עצמם. כל האסטרטגיות מבוססות הלמידת חיזוק גוברות על תיקים סטטיים גם מבחינת תשואות וגם מבחינת יחס שארפ, מדד נפוץ לתשואה ביחס לסיכון. בתוך הקבוצה הזו, תצורת הסולדה מהפסד מציעה נסיעה חלקה יותר עם ההפסדים המקסימליים הקטנים ביותר, תצורת הביטחון-יתר קוטפת את התשואות הגולמיות הגבוהות ביותר במחיר של תנודות גדולות יותר, ומסגרת BBAPT המלאה נמצאת על חזית היעילות, משלבת תשואות חזקות עם סיכון מתון. המחברים גם מתקנים שינויים בהרכב המדד כדי להגן מפני הטיית הישרדות ומוצאים שהמסקנות המרכזיות נשארות תקפות.

מה המשמעות עבור משקיעים יום-יומיים

ללא-מומחים, המסר המרכזי הוא שמסחר אלגוריתמי מוצלח לא חייב להתעלם מפסיכולוגיה אנושית; ניתן לנצל אותה. על ידי בניית גרסאות מבוקרות של פחד ועוז בתוך סוחר בינה מלאכותית — ומתן דחליל תחזיות שיחליט מתי כל תכונה צריכה לשלוט — מסגרת BBAPT יוצרת תיקים שמתאימים את עצמם לעליות ולשפלות באופן אינטואיטיבי יותר. העבודה מרמזת על עתיד שבו מערכות מסחר "חכמות" אינן רק מונחות נתונים, אלא גם מודעות להתנהגות, ומציעות למשקיעים כלים העמידים יותר וקלים יותר להבנה מאשר מודלים תיבת-שחורה שמניחים רציונליות מושלמת.

ציטוט: Charkhestani, A., Esfahanipour, A. Behaviorally informed deep reinforcement learning for portfolio optimization with loss aversion and overconfidence. Sci Rep 16, 6443 (2026). https://doi.org/10.1038/s41598-026-35902-x

מילות מפתח: מסחר אלגוריתמי, מימון התנהגותי, למידת חיזוק, אופטימיזציית תיק, שווקי מטבעות קריפטו