Clear Sky Science · he

LIMO: מאנילר זיכוך בזיכרון צר-צריכת-אנרגיה ופרימיטיב לכפל מטריצות עבור מחשוב בקצה

· חזרה לאינדקס

מסלולים חכמים ושבבים צרי-משקל

כל יום חברות מתמודדות עם חידות כמו מציאת המסלול הקצר ביותר למשאית משלוחים שעוברת באלפי נקודות או סריקה מהירה של תמונות לזיהוי פנים במצלמה על סוללה. הבעיות הללו מעמיסות על המחשבים של היום, שמעבירים כמויות עצומות של נתונים הלוך ושוב בין זיכרון ומעבדים. מאמר זה מציג את LIMO, יחידת חישוב חדשה חסכונית באנרגיה ששומרת את הנתונים במקום בזמן שהיא פותרת משימות קשות של תכנון מסלולים ומריצת מודלים של בינה מלאכותית, מה שמאפשר למכשירי קצה עתידיים להיות מהירים ויעילים יותר באנרגיה.

מדוע מציאת מסלולים טובים קשה כל כך

בלב עבודה זו נמצאת הבעיה המפורסמת של הסוחר הנודד: בהינתן ערים רבות, למצוא את המסלול הקצר ביותר שעובר בכל עיר פעם אחת וחוזר לנקודת ההתחלה. במפות קטנות כלים מתמטיים מדויקים יכולים למצוא את התשובה הטובה ביותר. אבל ככל שמספר הערים גדל לעשרות אלפים, מספר המסלולים האפשריים מתפוצץ ואף מחשב חזק נכשל. היוריסטיקות כמו אנילינג מדומה (simulated annealing) יכולות לחפש בחלל העצום הזה מסלולים טובים אם לא מושלמים, על ידי קבלת מדי פעם של מסלולים ביניים גרועים יותר כדי לא להיתקע במינימום מקומי. עם זאת, השיטות הסטנדרטיות עדיין חוקרות את מרחב החיפוש באופן לא יעיל בבעיות מאוד גדולות ובזבוז זמן בהעברת נתונים בין זיכרון למעבד — ה־"קיר זיכרון".

Figure 1
Figure 1.

דרך חדשה לחפש את האפשרויות

המחברים מציעים אלגוריתם חדש בשם Significance Weighted Annealed Insertion (SWAI) שמשנה את הדרך שבה בוחנים מועמדי מסלולים. במקום להחליף בזוגות ערים באופן קבוע, מה שקנה מידה רע ככל שמספר הערים גדל, SWAI בונה מסלולים שלב אחרי שלב, תוך הכנסת עיר חדשה בכל פעם. בכל שלב הוא לעתים בוחר בעיר הקרובה הבאה (בחירה חמדנית) ולפעמים מסתמך על אקראיות מבוקרת שמעדיפה קווים מועמדים קצרים יותר אך לא שוללת לחלוטין ארוכים יותר. ההטיה הזו מכויילת לאורך הזמן — בתחילה יותר נועזת ובהמשך מתגמנת לשמרנות ככל שהחיפוש מתקדם. מכיוון שכל שלב בוחן אפשרויות בצורה שגדלה בקצב קווי בלבד ביחס למספר הערים, האלגוריתם חוקר שיפורים לטווח ארוך באופן יעיל יותר מאנילינג מדומה מסורתי.

חישוב בתוך הזיכרון עם אקראיות מובנית

LIMO מממש את האלגוריתם הזה בחומרה באמצעות תכנון משותף הדוק של המעגלים והשיטה החיפושית. בלב המערכת נמצא מערך זיכרון מותאם שמאחסן הן את המסלול הנוכחי והן את המרחקים בין הערים, ומבצע את שלבי העדכון המרכזיים בלי שיחה מתמדת עם מעבד נפרד. בחירות אקראיות הנדרשות על ידי האלגוריתם מגיעות ממכשירים מגנטיים זעירים הנקראים spin-transfer-torque magnetic tunnel junctions, שעסקם להתהפך בצורה בלתי צפויה כאשר מניעים אותם עם זרם מתאים. המעצבים ממירים את האקראיות הפיזית הזו לביטים דיגיטליים ומשתמשים בהשוואות פשוטות כדי לממש את ההחלטות הפרובביליסטיות של האלגוריתם. מאחר שרוב הפעולות נשארות דיגיטליות ומתרחשות ישירות בתוך הזיכרון, המערכת נמנעת ממתאמי אותות גדולים וממעגלים אנלוגיים פגיעים, וחוסכת גם בצריכת אנרגיה וגם בשטח שבשבב.

שבירת בעיות גדולות לחתיכות

כדי להתמודד עם משימות תכנון מסלול ענקיות עד 85,900 ערים, המערכת משתמשת באסטרטגיית חלוקה וכיבוש. שיטה גיאומטרית קלה מקבצת ערים סמוכות עד שכל אשכול קטן מספיק כדי להתאים ליחידת LIMO אחת. החומרה פותרת רבים מהתת־מסלולים האלה במקביל, ואז תופרת אותם חזרה לכדי מסלול מלא. שלבי חדד נוספים מלוטשים את המסלול העולמי: מקטעים במסלול ממוטבים מחדש על ידי החומרה, וניקוי מסורתי מסוג "2-opt" על מעבד רגיל מסיר את המעברים החוצים שנותרו. במבחנים על בנצ'מרקים סטנדרטיים, הגישה המשולבת הזו הפיקה מסלולים באיכות גבוהה יותר מאשר מכונות אנילינג מיוחדות קודמות, תוך הגעה לתשובות עד בערך פי חמש מהר יותר בבעיות הגדולות ביותר.

Figure 2
Figure 2.

ממשימות קשות של מסלולים לאלגוריתמי בינה יעילים

LIMO אינו מוגבל לתכנון מסלולים. אותו מערך זיכרון יכול לשמש גם כבלוק לבניית רשתות עצביות על ידי ביצוע כפל וקטור–מטריצה, הפעולה הליבה מאחורי זיהוי תמונה ודפוסים. במקום להשתמש בממירים מדויקים וצרי־אנרגיה לקריאת אותות אנלוגיים, LIMO מסתמך על מעגלי חישה פשוטים ביותר שתופסים רק את סימן הסיגנל המצטבר, ופוצה על חוסר הדיוק הזה באמצעות אימון הרשתות באופן המודע לחומרה. במשימות של סיווג תמונות וזיהוי פנים, רשתות אלה הגיעו לדיוק הקרוב לדגמים תוכנתיים סטנדרטיים, תוך הפחתת צריכת האנרגיה וזמן התגובה בהשוואה לשבבי compute-in-memory קונבנציונליים. עבור משתמשים יום‑יומיים, המשמעות היא שמצלמות, רחפנים ומכשירי קצה אחרים עשויים בעתיד לפתור בעיות תכנון מורכבות ולהריץ מודלים של בינה מלאכותית לזמן רב יותר על סוללה, הכל הודות לחיפוש חכם ולחישוב ישירות במקום שבו הנתונים נמצאים.

ציטוט: Holla, A., Chatterjee, S., Sen, S. et al. LIMO: Low-power in-memory-annealer and matrix-multiplication primitive for edge computing. npj Unconv. Comput. 3, 10 (2026). https://doi.org/10.1038/s44335-026-00054-8

מילות מפתח: חישוב בתוך זיכרון, בעיה של הסוחר הנודד, אנילינג בחומרה, בינה מלאכותית צרת-צריכת-אנרגיה, מחשוב בקצה