Clear Sky Science · he

למידה ללא משוב בצורה סגורה באמצעות ההטלה קדימה

· חזרה לאינדקס

ללמד מכונות בלי מסרים לאחור

רוב הבינה המלאכותית המודרנית לומדת באמצעות שיטה הנקראת חישוב גרדיאנט לאחור (backpropagation), שבה שגיאות נשלחות אחורה דרך הרשת כדי לכוונן את הקשרים הפנימיים שלה. עם זאת, תהליך זה שונה מהאופן שבו מוח ביולוגי פועל ויכול להיות איטי ותובעני במשאבים. מאמר זה מציג דרך חדשה שבה רשתות עצביות יכולות ללמוד, הקרויה "הטלה קדימה" (Forward Projection), שמשליכה את שלב ההחזרת השגיאות כליל אך עדיין משיגת ביצועים חזקים, במיוחד במשימות ביומדיקליות קשות עם מעט נתונים.

דרך חדשה להנחיית הלמידה

רשתות עצביות מסורתיות לומדות על ידי השוואת התחזיות שלהן לתשובות הנכונות ושליחת אותות שגיאה לאחור דרך כל שכבה כדי לכוונן את החיבורים. ההטלה קדימה בוחרת מסלול שונה. במקום להסתמך על מסרים אחוריים אלה, היא משתמשת רק במידע הזמין כאשר האותות נעים קדימה: פעילות השכבה הנוכחית והתווית היעד. בכל שכבה השיטה משלבת את הקלט לאותה שכבה ואת התווית הרצויה באמצעות הטלות אקראיות קבועות שעוברות פעולת אי-קווים (nonlinearity) פשוטה. זה מייצר "יעד" של אות פנימי לשכבה—תבנית של פעילות דמויית-ממברנה שהשכבה אמורה לנסות להתאים לה.

לאחר יצירת היעדים, משוקלים משקליה של כל שכבה בפתרון בודד באמצעות רגרסיה בצורה סגורה, נוסחה סטטיסטית סטנדרטית במקום שיפוע אינטראטיבי. משמעות הדבר היא שהרשת יכולה להיות מאומנת בעברה יחידה על מערך הנתונים, ללא חזרה חוזרת על אותם דוגמאות או אחסון כמויות גדולות של אקטיבציות ביניים. מאחר שאין צורך שהמידע ייסע אחורה, השיטה מתיישבת עם התקשורת חד-כיוונית הנצפית בנוירונים ביולוגיים ועלולה להיות קלה יותר ליישום על חומרה מיוחדת עם חיבורים חד-כיווניים.

Figure 1
Figure 1.

לראות משמעות בפעילות החבויה

יתרון בולט של ההטלה קדימה הוא שהאותות הפנימיים בשכבות הנסתרות הופכים לניתנים לפרשנות ישירה. מאחר שכל שכבה מאומנת במפורש לקודד הן את הקלט והן את התווית בפוטנציאלים הדמויי-ממברנה שלה, ניתן לקרוא לערכים הפנימיים הללו כהתחזיות מקומיות של המחלקה. המחברים מראים כיצד "לפענח" בערך אותות אלה בחזרה למרחב התוויות, ולהפוך דפוסי פעילות להסברים לכל שכבה שמציינים מה הרשת סבורה בכל שלב. בניסויים, ההסברים הללו נהיים מדויקים יותר בשכבות העמוקות יותר, משקפים למידה מתקדמת—שכבות מוקדמות תופסות דפוסים רחבים בעוד ששכבות מאוחרות מתמקדות בפרטי החלטה קריטיים.

יכולת ההסבריות הזו חשובה במיוחד ברפואה, שבה ההבנה מדוע מודל קיבל החלטה יכולה להיות חשובה לא פחות מההחלטה עצמה. תוך שימוש בנתוני אלקטרוקרדיוגרמה, המחברים מדגימים שההטלה קדימה מדגישה סימנים קליניים ידועים של התקף לב—כגון שינויים במקטעים מסוימים בגל—ברגעים הנכונים בזמן. בסריקות עיניים המשמשות לזיהוי גדילה לא תקינה של כלי דם, השיטה באופן טבעי מתמקדת בכיסי נוזלים, משקעים מבהיקים ואזורים הדומים לצלקות שלרוב מומחים מחפשים, אפילו כשהיא מאומנת עם כמה־מאות דוגמאות בודדות לכל מחלקה.

Figure 2
Figure 2.

אימון מהיר, תוצאות חזקות

הצוות השווה את ההטלה קדימה מול מספר אלטרנטיבות שמנסות גם הן להימנע מחישוב גרדיאנט מלא לאחור, וכן מול החישוב הרגיל של backpropagation. במשימות תמונה ורצף כגון ספרות Fashion-MNIST, זיהוי מקדמי DNA, גילוי התקף לב מתוך אלקטרוקרדיוגרמות וזיהוי עצמים, השיטה החדשה התאימה או עולה בביצועיה על חוקי למידה מקומיים מתחרים. בהגדרות סטנדרטיות, backpropagation שמרה על יתרון כולל, אך הדיוק של ההטלה קדימה התקרב באופן מפתיע תוך שימוש בעבר יחיד של האימון.

היתרונות הובלטו בתרחישי "למידה ממעט דוגמאות" (few-shot), שבהם זמינים רק מספר מצומצם של דוגמאות מתוייגות, כפי שנפוץ בפרקטיקה קלינית. כאן ההטלה קדימה לעיתים כללה הכללה טובה יותר מאשר גם backpropagation וגם שיטות מקומיות מתחרות בצילומי חזה, סריקות רשתית ותתי-קבוצות תמונה קטנות. backpropagation נטה להתאים יתר על המידה למערכי הנתונים הזעירים או להיכשל בלמידת ייצוגים עשירים מספיק, בעוד שההטלה קדימה הפיקה ייצוגים פנימיים יציבים יותר וניתנים לשימוש חוזר. מבחינה חישובית, אימון שכבה גדולה דרש סדרי גודל פחותים בהרבה של פעולות כפל-וסכימה מאשר הרצת מאות רבות של אפוכים של backpropagation, מה שתורגמה להאצות משמעותיות ולצריכת אנרגיה נמוכה יותר.

מה זה אומר לעתיד הבינה וחישוב בהשראת המוח

באופן יומיומי, עבודה זו מראה שלרשתות עצביות לא חייבים להסתמך על לולאות משוב כבדות ובלתי-ביולוגיות כדי ללמוד ייצוגים פנימיים שימושיים וברורים. על ידי שילוב חכם של קלטים ותוויות במעבר קדמי אחד ופתרון המשקלים בצורה סגורה, ההטלה קדימה מציעה דרך לאמן מודלים במהירות, לפרש את מנגנוני הפנימיים שלהם ולטפל במערכי נתונים ביומדיקליים קטנים ורועשים. בזמן ש-backpropagation נשאר הסטנדרט הזהב למשימות בקנה מידה גדול רבות, גישה זו ללא משוב מצביעה על אסטרטגיות למידה דומות יותר למוח וידידותיות לחומרה שעשויות לתמוך בדור הבא של מערכות בינה יעילות ובעלות הסבר.

ציטוט: O’Shea, R., Rajendran, B. Closed-form feedback-free learning with forward projection. Nat Commun 17, 2414 (2026). https://doi.org/10.1038/s41467-026-69161-1

מילות מפתח: למידה ללא משוב, רשתות עצביות, אימון עם דוגמאות מועטות, בינה רפואית, למידה עמוקה להסבר