Clear Sky Science · he
רשת ניורונים למידול היווצרות, הבנה ותקשורת של מושגים אנושיים
כיצד המוחות הופכים ראייה לרעיונות
כשאתה שומע את המילה “ארוחה”, אתה יכול לדמיין שולחן, ריחות וקולות, אפילו בלי לראות אוכל ממש. היכולת הזו להפוך חוויות עשירות של ראייה ושמע לרעיונות דחוסים ואז לקרוא להן מאוחר יותר היא הבסיס לשפה, לתכנון ולהבנה משותפת. המאמר מציג סוג חדש של רשת ניורונית מלאכותית שמנסה ללכוד את הקסם היומיומי הזה של המחשבה האנושית, ומציע תובנות על האופן שבו המוח עשוי לארגן ידע וכיצד מכונות עתידיות יכולות לחשוב בצורה דמוית-אדם יותר.

דחיסת חוויה עשירה לקודים פשוטים
המחברים מתחילים משאלה פשוטה: כיצד המוח מדחס קלט חושי מפורט לקבוצת מושגים קטנה יותר, ואז משתמש במושגים אלה באופן גמיש? רשתות מלאכותיות עכשוויות מצטיינות בזיהוי תמונות, אך הן מסתירות את מה שלמדו בתוך מיליוני פרמטרים, מה שמקשה על שימוש חוזר בידע או על שיתופו עם מערכות אחרות. מצד שני, מודלים שפתיים גדולים נשענים על מילים אנושיות קיימות במקום לבנות מושגים ישירות מתמונות וקולות. המסגרת החדשה, שנקראת CATS Net, נועדה למודל גם את היווצרות המושג וגם את השימוש בו בתוך מערכת יחידה, כאשר תחילת האימון היא רק ממשימות חזותיות.
שני מודולים משתפי פעולה למושגים והחלטות
CATS Net מפצלת את החשיבה לשני חלקים שמשתפים פעולה. מודול הפשטת המושג לומד קוד מספרי קצר, או “וקטור מושג”, לכל סוג אובייקט — למשל תפוחים או אוטובוסים — בהתבסס על דוגמאות חזותיות. מודול נפרד לפתרון משימות מקבל תכונות תמונה מגוף ראייה סטנדרטי וחייב לענות על שאלות פשוטות כן/לא כמו “האם זה תפוח?” הטריק המרכזי הוא תהליך של שִׁעונוּת (gating): וקטור המושג שולט כיצד פעילות זורמת דרך שכבות פתרון המשימה, ומשנה את אותה רשת כך שתתאים למושגים שונים בלי לשנות את החיווט העיקרי שלה. האימון מתחלף בין כוונון המודולים להתאמת וקטורי המושג, כך שגם הרשת וגם המושגים הפנימיים שלה מתמחים בהדרגה.
גילוי מפה של משמעות בדומה לאדם
לאחר אימון על מאגרי תמונות גדולים, CATS Net לא רק מסווג תמונות שלא נראו קודם בצורה מדויקת, אלא גם מפתח “מרחב מושגים” מאורגן. קודים סמוכים נוטים לייצג דברים קרובים בקשר, כמו חיות שמתאספות יחד או כלים שיוצרים קבוצה משלהם. המחברים מראים שהסידור הזה אינו אקראי: הוא מתיישב עם דפוסים שנמצאים במחקרים אנושיים שבהם אנשים מדרגים עד כמה עצמים דומים זה לזה, ובמודלים מבוססי שפה שמתארים משמעות על פני ממדים רבים, כמו אוכל, רהיטים או ערך רגשי. באופן מרשים, כאשר החוקרים משווים את דפוסי הדמיון הפנימיים של הרשת לסריקות מוח שנלקחו בזמן שנבדקים קוראים שמות עצמים, הם מגלים ששכבת המושגים תואמת לפעילות באזור חזותי ברמה גבוהה ושמודול השִׁעונוּת דומה לאזורים המעורבים בבקרת הגישה למשמעות.
שיתוף ידע באמצעות מושגים בלבד
המחקר גם בוחן האם מושגים בממד נמוך יכולים לשמש כמטבע משותף בין רשתות שונות. הצוות מאמן גרסאות נפרדות של CATS Net כ"מורה" וכ"תלמיד" על קבוצות קטגוריות החופפות, ואז מוסיף מודול תרגום קטן שמתאים וקטורי מושג ממרחב המורה למרחב התלמיד. בלי לשנות את משקלי הרשת הראשיים, התלמיד יכול להשתמש בוקטור מושג מתורגם עבור קטגוריה שלא ראה במהלך האימון ועדיין להצליח מעל הסיכוי המקרי בשיפוטי כן/לא. במבחנים אחרים, CATS Net משתמש בהצלחה במרחבי מושג נגזרים מבניו של השפה ובנתוני התנהגות אנושיים, ומתייחס אליהם כאילו היו הקודים הפנימיים שלה.

מדוע זה חשוב למוחות ולמכונות
באופן כללי, התוצאות מציעות שקודים מקוצרים של מושג, בשילוב עם שִׁעונוּת גמישה של עיבוד חושי, עשויים להציע מתכון מעשי לחשיבה מושגית בדומה לאדם. המודל מראה כיצד חוויות חזותיות עשירות יכולות לדחוס לייצוגים ברי־שימוש חוזר, ניתנים לשיתוף, והמסודרים לפי דפוסים שנראים גם בהתנהגות האנושית וגם בפעילות המוחית. אף על פי שהעבודה מתמקדת בעצמים מוחשיים שניתן לראות ולקרוא להם בשמות, היא מצביעה על מערכות עתידיות שיכולות ללכוד גם רעיונות מופשטים יותר, וקורבת את הבינה המלאכותית לצורת היווצרות, הבנה ותקשורת של מושגים כפי שאנשים עושים זאת.
ציטוט: Guo, L., Chen, H., Chen, Y. et al. A neural network for modeling human concept formation, understanding and communication. Nat Comput Sci 6, 497–511 (2026). https://doi.org/10.1038/s43588-026-00956-4
מילות מפתח: היווצרות מושגים, רשתות ניורוניות, קוגניציה סמנטית, התאמה למוח, תקשורת מושגים