Clear Sky Science · he

ייצוב פנימי של פלסטיות סינפטית משפר למידה וחוסן ברשתות עצביות מלאכותיות

· חזרה לאינדקס

כיצד המוח נותן השראה ללמידה יציבה יותר במכונות

כשאנו לומדים מיומנות חדשה, המוח שלנו נשאר מספיק גמיש כדי לקלוט מידע חדש אך גם יציב דיה שלא לשכוח את מה שכבר ידענו. בינה מלאכותית מודרנית לעתים מתקשה באיזון הזה: היא לומדת מהר אך עלולה להיות שבירה או לא יציבה. המחקר הזה שואב השראה מאותות המשוב שבמוח כדי לתכנן דרך חדשה שבה רשתות עצביות מלאכותיות ילמדו ביעילות רבה יותר ויישארו חסונות לנוכח רעש, משימות משתנות ודוגמאות מטעות.

אות מנחה חדש בתוך מכונות הלמידה

רוב מערכות הלמידה המכנית מסתמכות על מתכון פשוט: להשוות את תחזית הרשת לתשובה הנכונה ולשנות את הקשרים כדי לצמצם את הפער. גישה זו מלמטה ומעלה עובדת היטב אך מתעלמת מהאותות העשירות שמגיעות מלמעלה במוח, שנושאות ציפיות, הקשר וחיזויים. המחברים מציעים רכיב נוסף שנקרא ייצוב פנימי טופ-דאון (iTDS). במקום לרדוף אך ורק אחרי התשובה הנכונה, הרשת לומדת גם אות פנימי איטי שעוקב אחרי הפלט שלה בעבר. אות זה המשתנה בעדינות מוזן חזרה לכלל הלמידה, כך שכל חיבור מעוצב לא רק על ידי שגיאה חיצונית, אלא גם לפי האופן שבו הרשת נוטה להתנהג לאורך הזמן.

Figure 1. כיצד אות משוב פנימי איטי מייצב רשת לומדת ומשפר את הדיוק שלה לאורך זמן.
Figure 1. כיצד אות משוב פנימי איטי מייצב רשת לומדת ומשפר את הדיוק שלה לאורך זמן.

להשיג שהרשתות ייזכרו את ההרגלים שלהן

ב־iTDS, הרשת שומרת תיעוד רציף וממוצע של פעילות הפלט האחרונה שלה. הטראס הפנימי הזה לא מנסה לנבא נתונים עתידיים או קלט חושי גולמי; הוא פשוט הופך להדהוד מסונן של מה שהרשת כבר הפיקה. במהלך האימון, האיבר הרגיל של השגיאה דוחף את הקשרים אל היעד הנכון, בעוד האיבר הטופ-דאון משווה את הפלט הנוכחי להדהוד הזה. כאשר פעילות הרשת משתנה מאוד, שני ההשפעות הללו נוטות להצביע לכיוון דומה, מחזקות זו את זו ומאיצות את הלמידה. ככל שהאימון מתקדם והרשת מתייצבת לדפוס עקבי יותר, ההשפעה הטופ-דאון נחלשת בהדרגה ופועלת יותר כמייצב מאשר כמניע שינוי.

תזמון טוב יותר, סיווג ועמידה בכאוס

החוקרים בדקו את iTDS במספר סוגי רשתות עצביות, כולל חוזרות, מזינות קדימה ודגמי מאגר, על פני שש־עשרה משימות. אלה כללו מעקב אחרי אותות חלקים לאורך זמן, זיהוי ספרות בכתב יד ופתרון בעיות לוגיות פשוטות. במקרים רבים, הוספת iTDS הובילה לאימונים מהירים יותר ושגיאה נמוכה יותר מאשר למידה מפוקחת סטנדרטית בלבד, אפילו כאשר הדינמיקה הפנימית של הרשת הייתה כאוטית. השיטה הייתה יעילה במיוחד כאשר היו ברשת יחידות פעילות רבות או כאשר אותות הפלט תנודתו בחוזקה — תנאים הנפוצים הן בסביבות ביולוגיות והן במערכות מלאכותיות.

למידה מדוגמאות רועשות ומטעות

נתוני העולם האמיתי נדירים כשהם נקיים. כדי לבחון חסינות, המחברים הוסיפו בכוונה רעש לקלטים, סובבו תמונות הרחק מהזווית השגרתית ואף הזריקו "ניסויים נגדיים" שבהם דוגמאות צולבו עם התשובה השגויה. בתנאים המעיקים הללו, רשתות שהשתמשו רק בלמידה סטנדרטית נטו להגיב יתר על המידה, לעצב את הקשרים באופן לא מועיל. עם iTDS, האות הטופ-דאון האיטי פעל כבלם: כאשר הופיעה דוגמה מפתיעה או סותרת, שתי ההשפעות על הלמידה ביטלו חלקית זו את זו, והקטינו את גודל שינוי המשקל. כתוצאה מכך, רשתות עם iTDS היו עמידות יותר גם לעיוותים אקראיים וגם להפרעות מתוכננות שנועדו להטעות מסווגים.

Figure 2. כיצד משוב מתוך הפלט של הרשת מתאם בהדרגה את עוצמות הקשרים כדי להפחית אי־יציבות ורגישות לרעש.
Figure 2. כיצד משוב מתוך הפלט של הרשת מתאם בהדרגה את עוצמות הקשרים כדי להפחית אי־יציבות ורגישות לרעש.

מדוע חשובה ההפרדה בין משוב חיובי ושלילי

המחקר חקר גם מה קורה כאשר חלק מהקשרים מתמחים במעקב אחרי שגיאות חיוביות בלבד ואחרים רק אחרי שגיאות שליליות, בהד שמערכת עצבים מסוימת בתגובה לתגמולים ולכישלונות. הפרדה זו הפיקה באופן טבעי דפוסי קישוריות צופניים יותר, שבהם רבים מהקשרים נשארו קרובים לאפס בעוד תת־קבוצה קטנה נשאה את מרבית ההשפעה. צפיפות כזו ידועה כמגבירה הכללה, ובמקרה הזה היא הורידה עוד יותר את שיעורי השגיאה. המחברים הראו כי אילוץ פשוט שיגרום להרבה משקלים להישאר אפסיים חיקה רבות מהתועלת הזו, מה שמרמז שמשוב מתמחה עשוי להיות מסלול ביולוגי להשגת ייצוגים חסכוניים ודלילים.

מה משמעות הדבר למוחות ולמכונות בעתיד

בסך הכל, מסגרת iTDS מראה כי מתן תחושת־עצמי משתנה באיטיות של ההתנהגות האחרונה של הרשת יכול להפוך אותה ללומדת מהירה יותר ופתרת־בעיות יציבה יותר. במקום להסתמך אך ורק על אי־התאמה המידית לתשובה הנכונה, רשתות המשלבות תיקונים מהירים עם ייצוב עדין מלמעלה מטפלות ברעש, בלבול ובשינוי ברוך יותר. עבור מדע המוח, המודל מציע תחזיות קונקרטיות על האופן שבו מסלולי משוב עשויים לעצב למידה. עבור בינה מלאכותית, הוא מרמז כי בניית אותות ניטור עצמי על פני סביבות זמנים מרובות עשויה להיות דרך מעשית לפתח מערכות שלומדות יותר כמו אנחנו ומפסידות פחות כשהעולם נהיה מבולגן.

ציטוט: Pilzak, A., Pennington, B. & Thivierge, JP. Intrinsic stabilization of synaptic plasticity improves learning and robustness in artificial neural networks. Nat Commun 17, 4164 (2026). https://doi.org/10.1038/s41467-026-70920-3

מילות מפתח: פלסטיות סינפטית, משוב טופ-דאון, רשתות עצביות חוזרות, למידה חסונה, עמידות לרעש