Clear Sky Science · he
כוונון נוירוני מסתנכרן באופן דינמי עם מאניפולות עצם וטקסטורה לאורך ההיררכיה הראייתית
איך המוח רואה יותר מאשר רק פריטים
כשאתה מסרק במבט רחוב הומה, מוחך מייד מפיק משמעות מתוך מערבולת של מכוניות, פרצופים, עלים וצללים. אך תאים עצביים בודדים אינם נדלקים רק עבור קטגוריות נקיות כמו "מכונית" או "פרצוף". הם לעתים קרובות מגיבים להרבה תמונות לא קשורות, מה שמשאיר מדענים תוהים במה התאים הללו באמת מעוניינים. במחקר זה נעשה שימוש בבינה מלאכותית מתקדמת שמייצרת תמונות כדי לאפשר לנוירונים בודדים "לעצב" את התמונות האהובות עליהם, וחושף כיצד המוח מאזן רגישות לטקסטורות עדינות מול זיהוי של עצמים שלמים.
שני עולמות ויזואליים שונים
החוקרים עבדו עם שני גנרטורים חזקים לתמונות, שלכל אחד מהם "הגייה" ויזואלית שונה. הראשון, שנקרא DeePSim, מצטיין בהפקת טקסטורות ודפוסים עשירים, אך תמוניו לעתים חסרות עצמים ברורים שניתן לזהות. השני, BigGAN, אומן ליצור תמונות חדות כמו צילום המלאות פריטים מובחנים כגון חיות וכלים. על ידי התייחסות לגנרטורים אלה כאל דרכים חלופיות לחתוך את מרחב התמונות האפשרי, יכל הצוות לבחון האם תאי מוח מתיישרים יותר עם מבט ממוקד-טקסטורה או עם מבט ממוקד-עצם על העולם.
לאפשר לנוירונים לבחור את התמונות שלהם
במניפים מקרקאים, המדענים רשמו פעילות של נוירונים לאורך נתיב הראייה הוונטרלי — שרשרת אזורים מוחיים שעוזרת להפוך ראייה גולמית לזיהוי עצמים. הם התמקדו בשלושה תחנות: V1 (קורטקס ראייתי ראשוני), V4 (אזור ביניים) ו-PIT (קורטקס אינפרו-טמפורלי אחורי, אזור ברמה גבוהה). במהלך הניסויים, שיעור הירי של כל נוירון הנחה חיפוש בלולאה סגורה במרחב התמונות של כל גנרטור. ברצפים מהירים הוצגו לנוירון תמונות סינתטיות; התמונות שגרמו ליותר צפצופים דחפו את הגנרטור לכיוון תמונות דומות בסיבוב הבא. לאורך דורות רבים, "אבולוציה" זו ייצרה תמונות המעוררות חזק הן במרחב הטקסטורה והן במרחב העצמים. 
תכונות מקומיות נסתרות, לא רק עצמים שלמים
להפתעה, כאשר נוירון מיטב תמונות הן במרחב הממוקד-טקסטורה והן במרחב הממוקד-עצם, התמונות הסופיות לעתים נראו שונות באופן גלובלי אך שיתפו מוטיף מקומי ספציפי — כגון קצה מעוקל או רצף צבעי — במיקום דומה. ניתוחים באמצעות רשתות עצביות עמוקות אישרו שהתמונות האלה בזוג היו דומות יותר במרחב התכונות מאשר תמונות שאופטימזו לנוירונים שונים. מפות מרחביות הראו שהפעילות של הנוירון חזויה ביותר על ידי אזורים מסוימים בתוך התמונות, מה שמרמז שרבים מהתאים מגיבים לגורמים מקומיים חוזרים שניתן למצוא בסצנות מאוד שונות, במקום לתבנית עצם קשיחה אחת.
הסטת איזון מטקסטורות לעצמים
הצוות בדק עד כמה נוירונים בכל אזור מוחי יכולים "לעלות" לתגובה חזקה בתוך כל מרחב תמונות. באזורים המוקדמים V1 ו-V4, האופטימיזציה במרחב הטקסטורה הצליחה לעתים קרובות יותר, טיפסה מהר יותר והגיעה לתגובות שיא גבוהות יותר מאשר במרחב העצמים, מה שחשף הטיה ברורה לטקסטורה. ב-PIT, לעומת זאת, הנוירונים הופיעו חזקים בשני המרחבים: ניתן היה להפעילם בחוזקה על-ידי תמונות סינתטיות דמויות-טקסטורה או דמויות-עצם, ומהירויות האופטימיזציה הפכו להשוות. הסתכלות על תזמון התגובות הוסיפה תפנית נוספת. ב-PIT, תמונות מבוססות-טקסטורה נטו להגביר תגובות מוקדמות, בעוד שתמונות מבוססות-עצם עוררו יותר ירי מאוחר ומתמשך, דבר שמעיד שתהליכי עיבוד ממוקדי-עצם צומחים לאט יותר בזמן.
מפות העדפה במרחב העצם
כדי לחקור את צורת ההעדפות המפורטת, החוקרים ביצעו ניסויי "כוונון הססיאן" (Hessian tuning) במרחב הלטנטי של גנרטור העצמים. לאחר שנוירון הגיע לתגובה חזקה לתמונה אופטימלית דמוית-עצם, הם דגמו שיטתי תמונות לאורך כיוונים רבים סביב הנקודה הזו. כאשר האופטימיזציה באמת מצאה פסגה גבוהה, הירי של הנוירון בדרך-כלל יצר מעגלי צליל בצורת פעמון לאורך כיוונים אלה — עלייה ואז ירידה כשהתמונות התרחקו מהמועדפת. כאשר האופטימיזציה לא הגיעה לפסגה חזקה, עקומות הכוונון לעתים נראו יותר כרמפות. זה מראה האם נוירון נראה כאילו יש לו מועדף צר או העדפה הדרגתית יכול להישען על כמה לעומק חיפשנו במרחב העצום של התמונות האפשריות. 
מה המשמעות של זה להבנת הראייה
בסך הכל, המחקר מצייר תמונה של נתיב הראייה הוונטרלי כמערכת גמישה שמתחילה בהעדפת טקסטורות ובהדרגה מפתחת אחיזה חזקה גם במבנה העצם. במקום לקודד עצמים שלמים כיחידות בלתי ניתנות לפירוק, נראה שהנוירונים מעדיפים תכונות מקומיות ניתנות לשימוש חוזר שניתן לשלבן לתוך סצנות רבות ושונות. נוירונים ברמת PIT הגבוהה יכולים להתיישר הן עם תיאור מבוסס-טקסטורה והן עם תיאור מבוסס-עצם של העולם הוויזואלי, וכושר הסתגלות זה קשה עדיין לרשתות מלאכותיות עכשוויות לחקות. עבור קורא שאינו מומחה, המסר המרכזי הוא שמוחותינו אינם פשוט "גלאי עצמים": הם מנועי דפוסים מתוחכמים שיכולים לקרוא משמעות הן מטקסטורות דקיקות והן מצורות שלמות, ומשנים את הדגש במרחב ובזמן כדי לתמוך בחוויה הוויזואלית העשירה שאנו לוקחים כמובן מאליו.
ציטוט: Wang, B., Ponce, C.R. Neuronal tuning aligns dynamically with object and texture manifolds across the visual hierarchy. Nat Neurosci 29, 864–875 (2026). https://doi.org/10.1038/s41593-026-02207-1
מילות מפתח: קורטקס ויזואלי, זיהוי עצמים, עיבוד טקסטורות, מודלים ג׳נרטיביים, כוונון נוירוני