Clear Sky Science · he

מיפוי יעיל של יישומי למידה עמוקה על חומרה ברזולוציה מעורבת באמצעות סופר‑רשת והתאמת מודל

· חזרה לאינדקס

למה שבבים חכמים יותר חשובים

בינה מלאכותית מודרנית מפעילה הכל, מעוזרי קול ועד ניתוח תמונות רפואיות, אך המחשבים שמריצים מערכות אלה נתונים בעומס רב. ככל שהמודלים גדלים, הם דורשים יותר אנרגיה, זיכרון וזמן לחיזוי. המאמר חוקר דרך חדשה להתאים תוכנת בינה מלאכותית לחומרה מתמחה, כך שמערכות יוכלו לפעול מהר יותר ובצריכת אנרגיה נמוכה יותר תוך שמירה על הדיוק. המוקד הוא על שילוב שתי צורות חישוב — אנלוגית ודיגיטלית — ועל החלטה אוטומטית אילו חלקים ברשת העצבית צריכים להשתמש באיזו צורה.

שני סוגי 'מוח' עבור מכונה אחת

שבבי הבינה של היום מתחילים לשלב יחידות דיגיטליות מסורתיות עם מנועים אנלוגיים "בזיכרון" היכולים לבצע בלוקים גדולים של חישוב בתוך הזיכרון עצמו. היחידות האנלוגיות מהירות וחסכוניות באנרגיה מאוד, אך גם רועשות ופחות מדויקות. היחידות הדיגיטליות, לעומת זאת, איטיות ופחות יעילות אך מהימנות מאוד. אתגר מרכזי הוא להחליט, שכבה אחרי שכבה, היכן ברשת העצבית לרוץ באופן אנלוגי והיכן להישאר דיגיטלית כדי שהמערכת כולה תעבוד היטב. אם יותר מדי שכבות ירוצו באנלוגי, הדיוק ירד; אם יותר מדי יישארו דיגיטליות, החיסכון באנרגיה והשיפור במהירות יהפכו לזניחים.

Figure 1. כיצד משימות בינה מלאכותית עוברות דרך חומרה אנלוגית ודיגיטלית כדי לספק תוצאות מהירות, מדויקות וחוסכות אנרגיה.
Figure 1. כיצד משימות בינה מלאכותית עוברות דרך חומרה אנלוגית ודיגיטלית כדי לספק תוצאות מהירות, מדויקות וחוסכות אנרגיה.

מפה של רשתות אפשריות רבות

המחברים מציגים את סופר‑הרשת ברזולוציה מעורבת, מודל גדול שמכיל בו זמנית גרסאות רבות של אותה רשת עצבית. עבור כל שכבה, סופר‑הרשת כוללת מספר אפשרויות: גרסה דיגיטלית ברזולוציות ביט שונות, גרסה אנלוגית הכוללת רעש מציאותי, ואפילו אפשרות לדלג על שכבות או לשנות את צורתן. במהלך האימון, המערכת לומדת לא רק את המשקלים הרגילים של הרשת, אלא גם עד כמה כל בחירת חומרה טובה עבור כל שכבה. שיטת דירוג מיוחדת ואז מחפשת בחלל האפשרויות הזה כדי למצוא "מיפויים" שכבה‑אחר‑שכבה שמאזנים שלושה יעדים בו‑זמנית: דיוק המשימה, כמה עבודה מתבצעת על חומרה אנלוגית וכמה זיכרון דיגיטלי נדרש.

להכשיר את המודל שיתאים לחומרה

מעבר לבחירה בין אנלוגי לדיגיטלי, המסגרת יכולה לעצב בעדינות את הרשת כך שתתאים לחומרה בצורה טבעית יותר. למשל, היא יכולה להרחיב שכבות פנימיות מסוימות במטרנספורמר או בבלוק קונבולוציה כדי שיתמלאו באופן מלא יותר בטיל אנלוגי, שימוש ביותר שורות ועמודות זמינות ללא הוספת השהייה. התאמות המודעות לחומרה אלה מגדילות את מספר הפרמטרים בכמה שכבות, אך מאחר שהן ממוקמות במקום שבו החומרה האנלוגית יעילה, עלות האנרגיה הכוללת נשארת נמוכה. המערכת מתאמנת בשלבים: תחילה היא מטפלת בכל הנתיבים בהגינות, ואז מכניסה בהדרגה כימות ורעש אנלוגי אמיתי, ולבסוף ממצקת את הבחירות כדי לשמור על האיזון הטוב ביותר בין דיוק ויעילות.

Figure 2. כיצד כל שכבה ברשת העצבית מוקצת לחומרה אנלוגית או דיגיטלית כדי לאזן בין דיוק, צריכת אנרגיה ומהירות.
Figure 2. כיצד כל שכבה ברשת העצבית מוקצת לחומרה אנלוגית או דיגיטלית כדי לאזן בין דיוק, צריכת אנרגיה ומהירות.

חיפושים מהירים יותר ופשרות טובות יותר

הצוות בחן את הגישה שלהם על מספר משימות סטנדרטיות: סיווג תמונות על CIFAR‑10, סגמנטציה של עצמים בערכת COCO ומענה על שאלות ב‑SQuAD. בכל הניסויים, השיטות שלהם, שנקראות MPS והמתקדמת יותר MPAAS, מצאו באופן עקבי מיפויים שהשתמשו בשיעור גבוה של פעולות אנלוגיות תוך שמירה על הדיוק ולעיתים אף שיפור קל לעומת הבסיסים הנפוצים. בממוצע, המיפויים שלהם התגלו בכ‑כ‑2.2 מהר יותר משיטות מתחרות והניבו כ‑3.4 אחוז שיפור בביצועי המשימה בהשוואה לעיצוב כולו‑אנלוגי. סימולציות חומרה הראו שהעיצובים שהתקבלו יכולים לקצץ בעכבה עד כ‑2.4 פעם ובאנרגיה לכל חיזוי בכ‑2.6 פעם ביחס למערכות דיגיטליות ברזולוציה מלאה.

מה המשמעות לחומרת בינה עתידית

עבור לא‑מומחים, המסר המרכזי הוא שהאופן שבו מודל בינה מלאכותית מפוזר על שבב חשוב כמעט כמו המודל עצמו. עבודה זו מראה כי "מתכנן" אוטומטי המודע לחומרה יכול להחליט אילו חלקים ברשת צריכים לרוץ על חומרה אנלוגית מהירה אך רועשת ואילו צריכים להישאר ביחידות דיגיטליות מדויקות, ולעתים לעצב מחדש את המודל כדי שישתלב טוב יותר בשבב. התוצאה היא בינה מלאכותית שמספקת דיוק דומה תוך שימוש הרבה פחות באנרגיה וזמן — צעד חשוב להפוך מודלים רבי עוצמה לפרקטיים במכשירים כמו טלפונים, רכבים ושרתים קצה במקום רק במרכזי נתונים גדולים.

ציטוט: Benmeziane, H., Lammie, C., Boybat, I. et al. Supernetwork-based efficient mapping of deep learning applications to mixed-precision hardware using model adaptation. Nat Commun 17, 4501 (2026). https://doi.org/10.1038/s41467-026-71071-1

מילות מפתח: חומרה ברזולוציה מעורבת, חישוב אנלוגי בזיכרון, מיפוי רשת עצבית, בינה מלאכותית מודעת לחומרה, אינפרנציה חסכונית באנרגיה