Clear Sky Science · he

חיזוי עומס מבוסס-תשומת לב והקצאת משאבים דינמית בסביבות חישוב הטרוגניות

· חזרה לאינדקס

מדוע מחשבים חכמים יותר חשובים לכולנו

מאחורי כל סרטון שאתם משדרים, מפה שאתם פותחים או עוזר בינה מלאכותית שאתם מדברים איתו, מחבואי מחשבים עצומים פועלים שקט סביב השעון. ככל שהבינה המלאכותית נעשית חזקה יותר, מרכזי הנתונים נדרשים יותר ויותר: הם צריכים לנהל סוגים רבים של עבודות על סוגים רבים של מכונות תוך שמירה על עלות, מהירות וצריכת אנרגיה. מאמר זה מציג שיטה חדשה לחיזוי מה המחשבים האלה יזדקקו לו בעתיד הקרוב ולשיבוץ עבודה בחומרה שונה כך שהשירותים יישארו מהירים ואמינים תוך בזבוז קטן יותר של חשמל.

עבודות רבות, מכונות רבות

מרכזי נתונים מודרניים כבר לא מסתמכים על סוג שרת יחיד. במקום זאת הם משלבים מעבדים מסורתיים עם שבבי גרפיקה חזקים, לוחות ייעודיים ל-AI ומעגלים הניתנים לתכנות מחדש. משימות AI שונות — כגון אימון מודל שפה גדול, מתן המלצות בזמן אמת או ניתוח תמונות — מתאימות למכונות האלה באופן שונה מאוד. כיום מפעילים לעיתים קרובות מקצים משאבים באמצעות חוקים נוקשים או תחזיות פשוטות המבוססות על שימוש אתמול. כשהביקוש מזנק באופן פתאומי, הדבר עלול לגרום לתגובות איטיות או להפרות בהסכמי שירות; כשהביקוש יורד, חומרה יקרה עשויה לשבת ללא מעש ולצרוך חשמל רב תוך ביצוע מעט עבודה.

Figure 1
Figure 1.

ללמוד להסתכל למקום שבו זה חשוב

המחברים שואבים רעיון ממודלים מתקדמים של בינה מלאכותית שנקרא "תשומת לב" ומיישמים אותו בניהול מרכזי נתונים. במקום להתייחס לכל נתוני השימוש בעבר כאילו הם שווים, המערכת שלהם לומדת אילו רגעים בזמן ואילו סוגי עומסים מועילים ביותר לניחוש מה יקרה בהמשך. חלק אחד של המודל מתמקד באופן שבו כל עומס עבודה — כמו עבודת אימון או שירות מקוון — משתנה לאורך הזמן. חלק אחר בוחן לצד העיקרי עומסים שונים הרצים באותו הרגע כדי לחשוף קשרים חבויים, למשל דפוס שבו סיום אצווה של עבודות אימון מוביל לעתים לפרץ בשאילתות מקוונות קשורות. על ידי השכבת שתי התצפיות הללו, המערכת יכולה לחזות דרישות עתידיות למעבדים, זיכרון ומאיצים בדיוק גבוה יותר משיטות קודמות.

להפוך תחזיות להחלטות טובות יותר

תחזית לבדה אינה מספיקה; מרכז הנתונים חייב לפעול על פיה. החצי השני של המסגרת הופך את התחזיות הללו להחלטות קונקרטיות לגבי היכן להריץ כל משימה. המחברים מתייחסים לכך כאל פעילות איזון בין שלושה מטרות: לסיים עבודות במהירות, להשתמש בכמה שפחות אנרגיה ולשמור על המכונות עסוקות במקום להשאירן אינרטיות. המתזמן שלהם מציג את מרכז הנתונים כרשת של מכשירים שונים ומשתמש בהליך אופטימיזציה לבחירת מיקומים שמושכים ונותנים בין המטרות הללו לפי העדפות המפעיל. מאחר שתחזיות לעולם אינן מושלמות, המערכת גם מעריכה את אי-הוודאות שלה ומשאירה מרווחי בטיחות כשצריך, ואז עוקבת אחרי המציאות בזמן אמת כדי להתאים על ידי השהיית עבודות בעלות עדיפות נמוכה או העברת משימות כאשר השימוש סטה מהצפוי.

Figure 2
Figure 2.

לבדוק את המערכת במבחן

כדי לבדוק כיצד הגישה הזו עובדת בפועל, החוקרים בנו אשכול ניסוי עם תמהיל ריאלי של מעבדים, GPUs וחומרת AI ייעודית, והזינו אליו רשומות פעילות מפורטות ממרכזי נתונים בעולם האמיתי בגוגל, עליבאבא ומעבדה אקדמית. הם השוו את השיטה שלהם לכלים פופולריים לחיזוי ואסטרטגיות תזמון, כולל טכניקות המשומשות במערכות ייצור ובקרי מבוססי חיזוק. החזאי המבוסס-תשומת לב נתן באופן עקבי ניחושים מדויקים יותר, במיוחד לפרצי עומס חדים שמתרחשים לעתים בעומסי AI. כשהוא צמוד למקצה הדינמי שלהם, המערכת העלתה את ניצול החומרה הכולל לכ-80% מהקיבולת, קיצרה את זמן השלמת העבודות בממוצע בכ־רבע והפחיתה את צריכת האנרגיה בכ־15%, הכל תוך שמירה על שיעור הפרות שירות נמוך מאוד.

מה זה אומר למשתמשים היומיומיים

עבור קוראים שאינם מומחים, המסקנה העיקרית היא שתיאום חכם יותר בתוך מרכזי נתונים יכול להפוך שירותי AI למהירים, זולים וירוקים יותר בלי צורך בשבבים או מבנים חדשים. על ידי למידה היכן "להשקיע תשומת לב" בתוך שיטפון נתוני השימוש, המסגרת הזו מסייעת לחומרה קיימת לעשות יותר עבודה שימושית ולהיות פחות לא פעילה. משמעות הדבר היא שחברות יכולות לספק אפליקציות חַצְפָּנוֹת יותר וכלי AI חזקים יותר תוך הורדה של חשבונות החשמל וטביעות הפחמן. ככל שמערכות דומות לחיזוי והקצאה יתפשטו ויתבגרו, המכונות הבלתי נראות של האינטרנט עשויות להפוך לא רק ליותר יכולות אלא גם ליותר ברות-קיימא.

ציטוט: Shao, S., Ding, X., Zhao, B. et al. Attention-based workload prediction and dynamic resource allocation for heterogeneous computing environments. Sci Rep 16, 8571 (2026). https://doi.org/10.1038/s41598-026-38622-4

מילות מפתח: תזמון במרכזי נתונים, חיזוי עומסי AI, חישוב הטרוגני, חישוב חסכוני באנרגיה, הקצאת משאבים