Clear Sky Science · he
הכללה קוגניטיבית בדומה לבני אדם במודלים גדולים באמצעות השגחה מונחית ייצוגים מנטליים
מדוע חשוב ללמד בינה מלאכותית לחשוב כמונו
הבינה המלאכותית המודרנית יכולה לזהות פנים, לתייג תמונות ולכתוב טקסט שוטף, אך היא עדיין מתקשה בסוג ההבנה הגמישה שאנשים משתמשים בה יום־יום. אנחנו יכולים לראות ציפור אחת ואז לזהות עשרות סוגי ציפורים, או להבין שגם ערסל וגם עגלת תינוק כוללים שכיבה למנוחה. מאמר זה חוקר דרך חדשה לקרב את המודלים הממוחשבים לסוג החשיבה הדמוי־אנושי הזה על ידי שימוש בפעילות מוחית עצמה כאות הדרכה.
איפה המכונות החכמות של היום נכשלים
מערכות למידה עמוקה סטנדרטיות משתפרות בעיקר על ידי הגדלה והדרכה על יותר נתונים. המתכון הזה עובד היטב למשימות מוחשיות כגון זיהוי גרביים, ברבורים או מכוניות בתמונות. עם זאת, המחברים מראים שהגדלה של מספר הפרמטרים בלבד מביאה לשיפור מועט בלכידת רעיונות אבסטרקטיים כגון ביגוד, ציפורים, או ההבחנה הרחבה בין חי לדומם. כאשר המודלים נבדקו במשימות למידה בודדת (one-shot), הם השתפרו חזק על אובייקטים ספציפיים ככל שהתגדלו אך כמעט ולא השתפרו — ואפילו הידרדרו — בקטגוריות ברמה גבוהה. ניתוחים של האופן שבו המודלים מפרידים מושגים פנימית גילו שלא כמו המוח האנושי, הם לא קיבצו באופן טבעי יצורים חיים בנפרד מכלים וחפצים אחרים.

להניח למוח להנחות את המכונה
כדי להתמודד עם הפער הזה, החוקרים עיצבו מה שהם קוראים לו «השגחה מונחית ייצוגים מנטליים». מתנדבים שכבו בסורק מוח וצפו בהרבה תמונות טבעיות. מהקלטים הללו הוצאו דפוסי פעילות באזורים של קליפת הראייה הידועים בכך שהם מקודדים מידע גבוה ועשיר על מה שאנו רואים. במקביל, רשת מלאכותית עיבדה את אותן תמונות. הרעיון המרכזי היה לכפות שהמבנה הפנימי של דמיויות והבדלים בין עצמים ברשת יתאחד עם המבנה שנמצא במוח. המחברים טפלו גם במוח וגם במודל כגרפים של מושגים מקושרים והשתמשו בהליך התאמת־גרפים איטרטיבי כדי לקרב ביניהם.
כיצד מתנהגים מודלים מיושרים עם המוח
לאחר אימון מיוחד זה, המודלים לא רק שיננו את התמונות שמפקחים עליהן. במקום זאת, הם פיתחו מפת מושגים דמוית־אנוש שהתכללה לרבים מאובייקטים חדשים שמעולם לא הותאמו לנתוני מוח. המודלים המשופרים הפכו לטובים בהרבה בלמידה בודדת עבור קטגוריות אבסטרקטיות, והציגו אשכולות הדוקים יותר למושגים כגון חיה, כלי רכב או כלי נגינה. ההיררכיות הפנימיות שלהם התחילו להזכיר את WordNet, מאגר ידני של יחס מילים באנגלית, אף על פי שהמודלים מעולם לא הוכשרו במפורש על אותה מבנה. כשנשאלו לבחור את «הזרה» מתוך שלוש תמונות, המודלים המונחים על ידי המוח בחרו באופן שהשתווה יותר לשיפוטים אנושיים נרחבים. כמו כן הם הוכחו כקשים יותר להטעה עם עיוותים עדינים ומחושבים לתמונות, רומז על תפיסה עמוקה ועמידה יותר של מה הם עצמים.
חלון לחלל מושגי דמוי־אנושי
המחברים הלכו רחוק יותר ובחנו את ה״מניפה המושגית״, או המפה ממד־נמוכה, שעליה מבוססים המודלים המונחים על המוח. על ידי תנועה במפה הזו ופענוח נקודות לתיאורים בשפה טבעית, הם הראו שמיקומים סמוכים תואמים רעיונות סמנטיים קרובים, כגון סוגי ביגוד שונים או כלי רכב. אינטרפולציה בין אזורים יצרה מעברים חלקים, כמו מעבר ממכשירי אלקטרוניקה לעבר חיות ונחיתה על סוסים כאשר חוצים בין כלי רכב למכרסמים בעל־פרסות. המערכת יכלה גם לסכם מספר תמונות קשורות למשפט משמעותי יחיד ולבצע «חשבון מושגים» פשוט — להתאים כתוביות על־ידי הוספה או החסרה של אלמנטים כגון סוס או אופנוע בצורה שהלמה את האינטואיציה האנושית.

מה המשמעות לכך לעתיד ה-AI
במונחים יומיומיים, עבודה זו מציעה שהטיית מערכות בינה מלאכותית באמצעות המוח האנושי יכולה לעזור להן להתקדם מעבר להתאמת דפוסים לכיוון שדומה יותר לאופן שבו אנו מארגנים ידע. במקום להתמקד אך ורק בהגדלת המודלים, המחקר מראה שעיצוב מרחב המושגים הפנימי שלהם כך שישקף מבנה מוחי יכול להגביר את יכולתם להתמודד עם מצבים חדשים, אבסטרקטיים וחריגים. אף שהשיטה עדיין תלויה בסריקות מוח מפורטות של אנשים בודדים, הרחבה של אימון מונחה מוח עשויה להוליד מערכות מלאכותיות גמישות, ברורות יותר ומותאמות יותר לאופן שבו בני אדם תופסים ומנמקים על העולם.
ציטוט: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5
מילות מפתח: למידה מונחית מוח, מושגים אבסטרקטיים, רשתות עצביות עמוקות, היררכיית מושגים, הכללה קוגניטיבית