Clear Sky Science · he

קישורים יחזוריים מסייעים בזיהוי עצמים מוסתרים על ידי הסבר־התעלמות

· חזרה לאינדקס

איך המוח רואה את מה שאינו שם

ביום־יום אנו מזהים בלי מאמץ עצמים שהחלקם מוסתר—חתול שמאחורי וילון, מכונית שמאחורי עץ. המאמר שואל כיצד המוח, וכן רשתות מלאכותיות בהשראתו, מבצעים את המשימה הזו. המחברים מראים כי מעגלים עם לופ־פידבק יכולים להשתמש במידע על העצם שמסתיר כדי "להשלים" בדמיון את מה שמאחוריו, וחושפים טריק מרכזי שאולי המערכת הוויזואלית שלנו מסתמכת עליו כאשר העולם עמוס ובלתי שלם.

Figure 1
איור 1.

למה עצמים מוסתרים הם בעיה קשה

כשעצם מוסתר, רבים מהמאפיינים הוויזואליים המוכרים שלו חסרים או מעוותים. מערכת חזותית פשוטה של העברה קדימה, שבה המידע זורם מהעיניים למרכזי זיהוי באופן רציף, חייבת לנחש את העצם הלא נראה רק על סמך החתיכות הנראות. מוח ביולוגי, לעומת זאת, מלא בקישורים חוזריים—לולאות שבהן אזורים עליונים משוחחים חזרה עם אזורים מוקדמים. לולאות אלו נחשדו במשך זמן רב כמסייעות במשימות קשות כמו זיהוי עצמים מוסתרים, אך לא היה ברור בדיוק איזו יתרון הן מעניקות או כיצד הן משנות את הייצוגים הפנימיים של מה שאנו רואים.

בחינת רשתות בהשראת המוח

המחברים בנו סט רחב של רשתות קונבולוציוניות עמוקות המדמות שלבים בעיבוד חזותי. חלק מהן היו חד־כיווניות בלבד, בעוד שאחרות כללו לולאות חוזריות או פידבק על־מדי. הם אימנו את המודלים הללו על מערכי תמונות מותאמים שבהם פריט אופנה אחד כיסה חלקית פריט אחר. הרשתות נדרשו לזהות גם את הפריט הקדמי (המסתיר) וגם את הפריט האחורי (המוסתר) בתצורות משימה שונות. הביצועים התבססו פחות על האם הרשת היתה חוזרת או חד־כיוונית ויותר על "עמק חישובי"—כמה שלבי עיבוד ברצף עוברת הקלטה. דגמים עמוקים של העברה קדימה יכלו להתחרות ואף להתעלות על רשתות חוזריות במשימת הזיהוי הבסיסית, מה שמראה שחוזריות אינה עדיפה באופן קסום בפני עצמה.

טריק מיוחד: להסביר את המסתיר

למרות שעומק היה המשפיע העיקרי על הדיוק הגולמי, רשתות חוזריות הראו יתרון ייחודי באופן השימוש שלהן בהקשר. כשביקשו מהרשתות הללו לזהות תחילה את העצם הקדמי ורק לאחר מכן את העצם המוסתר, ביצועיהן על העצם המוסתר השתפרו בהשוואה למצב שבו סיווגו אותו לבד. דפוס זה לא הופיע ברשתות העברה קדימה רגילות שיצאו בשני התוויות בבת אחת. המחברים מפרשים זאת כ"explaining away": ברגע שהמערכת זיהתה את המסתיר, היא יכולה לייחס את התכונות החסרות או המוזרות בתמונה למסתיר, במקום לראות בהן ראיה לעצם חדש ומוזר. בסצנות תלת־ממדיות ריאליסטיות ובדגם בהשראת פרימטים (CORnet), הסידור הזה—עצם קדמי לפני עצם מוסתר—שיפר גם הוא את הזיהוי.

Figure 2
איור 2.

אותו אפקט גם אצל בני אדם

כדי לבדוק האם בני אדם משתמשים באסטרטגיה דומה, החוקרים ערכו ניסוי מקוון. המשתתפים ראו בקצרה עצם יחיד, לאחר מכן סצנה שבה עצם אחד הסתיר אחר, ולבסוף נדרשו לבחור איזה מבין שתי אפשרויות היה העצם המוסתר. בחלק מהניסויים העצם היחיד הראשוני היה זהה למסתיר המאוחר; באחרים הוא היה לא קשור. כאשר אנשים ראו זה זה עתה את המסתיר האמיתי, הם זיהו את העצם המוסתר בדיוק רב יותר וענו מהר יותר, על פני מגוון רמות של כיסוי. זה מצביע על כך שמוחנו, כמו הרשתות החוזריות, מרוויח מעיבוד הפריט החוסם קודם ואז משתמש בידע הזה כדי לפרש את הראיות החלקיות למה שמאחוריו.

שחזור תמונות מוסתרות מהפנים

כדי לחקור לעומק את המנגנון, המחברים תכננו דגם ביולוגית יותר, Recon-Net, המבוסס באופן רופף על אינטראקציות בין קורטקס חזותי וקורטקס פרה־פרונטלי. Recon-Net מקבל תמונה הכוללת עצם מוסתר בתוספת מבט נפרד על המסתיר ומחליף באופן איטרטיבי ייצוג פנימי עד שהוא תואם למה שהגרסה הלא־מוסתרת של העצם המוסתר אמורה להיראות. באופן מרשים, סווגים שאומנו רק על תמונות נקיות ולא־מוסתרות יכלו לזהות את פלטי Recon-Net כמעט באותה מידה כאילו הוכשרו ישירות על דוגמאות מוסתרות. משמעות הדבר היא שהעיבוד החוזרי "משחזר" בפועל תמונה פנימית נקייה של העצם המוסתר, למרות שהפיקסלים חסרים.

מה זה אומר למוחות ולמכונות

בסך הכל, המחקר מראה שלולאות פידבק אינן קשורות רק לביצועים גולמיים, אלא לאופן איכותי שונה של שימוש בהקשר. קישורים חוזריים תומכים באופן טבעי ב"explaining away": הם מאפשרים למערכת הוויזואלית לקחת בחשבון כיצד המסתיר מעוות את מה שאנו רואים ולשחזר ייצוג פנימי יציב של העצם המוסתר. במקביל, המחברים מגלים כי אימון על תמונות בעלי כיסוי כבד יכול להשאיר תגובות לתמונות ברורות חסר שינוי מהותי, מה שעשוי להקל על הלמידה במוחות אמיתיים על ידי הימנעות מפיצול מתמיד של חיבורים. התובנות הללו מצביעות על עיקרון משותף למדעי המוח ולבינה המלאכותית: כאשר העולם מסתיר מידע, מערכות חכמות אינן רק מסתכלות חזק יותר—הן מסיקות מדוע המידע חסר.

ציטוט: Kang, B., Midler, B., Chen, F. et al. Recurrent connections facilitate occluded object recognition by explaining-away. Nat Commun 17, 2225 (2026). https://doi.org/10.1038/s41467-026-68806-5

מילות מפתח: זיהוי עצמים מוסתרים, רשתות עצביות חוזרות, תפיסה חזותית, explaining away, מדעי המוח חישוביים