Clear Sky Science · he

הקצאת משאבי GPU המודעת למדיניות עבור מחשוב-על לאומי

· חזרה לאינדקס

מדוע מחשבי-על צריכים יותר מאשר מהירות בלבד

מאחורי הפריצות הדרך של היום בבינה מלאכותית, בדגמי אקלים ובחומרים חדשים עומד סוס עבודה נסתר: מחשבי-על לאומיים עמוסים ביחידות עיבוד גרפיות (GPU) עוצמתיות. הביקוש למכונות אלה כה גבוה שבאופן מעשי לא כולם מצליחים לקבל את זמן החישוב שהם מבקשים. מאמר זה שואל שאלה לכאורה פשוטה אך בעלת השלכות רחבות במדיניות המדעית: במקום לתת את רוב זמני ה־GPU לאלה שהכי צורחים חזק, האם ניתן להקצות אותם בדרך שמשקפת גם עדיפויות אסטרטגיות של המדינה, מבלי לבזבז קיבולת או להאט את המחקר?

Figure 1
Figure 1.

הבעיה בשיטה של "הראשון שבא—משרת ראשון"

מרבית מרכזי המחשוב הגדולים כיום משתמשים בחוקי תזמון שממוקדים לשמירה על עיסוק המכונות וניקוי תורים בצורה יעילה. מערכות בארצות הברית, אירופה, יפן ומקומות אחרים מעדיפות לעתים עומסים ארוכי־הרצה ועבודה בנפח גבוה כי אלה שומרים על ניצול גבוה ותזמון צפוי. אך גישה מונעת־ביקוש זאת יוצרת הטיה שקטה: תחומים שכבר מייצרים כמויות גדולות של עבודות GPU—כמו אזורים מסוימים במדעי המחשב—נוטים לקבל נתח הולך וגדל מהמשאבים, בעוד שתחומים בעלי חשיבות אסטרטגית אך בעלי צריכת GPU נמוכה יותר, כגון חלקים ממדעי החומרים או מדעי כדור הארץ, עלולים להידחק החוצה. ככל שהתחרות על שעות GPU מתגברת ומדינות מקשרות את מחשוב-העל יותר למטרות כלכליות וביטחוניות, חוסר האיזון הזה הופך לא רק לבעיה טכנית אלא לשאלת ערך ציבורי והגינות.

להכניס יעדי מדיניות למתמטיקה

המחקר מציע מסגרת ששוזרת עדיפויות מדיניות ישירות לנוסחאות שמנחות הקצאת GPU. במקום להתייחס למדיניות ככלי משלים—למשל, על ידי הצבת תקרות או מכסות באופן ידני—המחבר מגדיר "וקטור יעד מדיניות", בפועל אחוזי יעד רצויים של משאבי GPU לכל תחום מדעי. וקטור זה נבנה משלושה מרכיבים: דפוסי השקעה מחקריים לאומיים, תחומים מודגשים רשמית בעדיפות, ושימוש היסטורי ב‑GPU, כולם מעורבבים באופן שווה כך שלא ייגדל גורם יחיד על חשבון האחרים. לאחר מכן, לכל תחום המסגרת מנתחת כיצד עבודות מתנהגות בפועל על המערכת—כמה זמן הן רצות וכמה פעמים מופיעות עבודות ארוכות מאוד—ומסכמת זאת בפרופילים מספריים פשוטים.

מציאת האיזון בין ביקוש והגינות

באמצעות פרופילים אלה, המסגרת בונה שני אותות לכל תחום: אחד שמודד עד כמה דפוס השימוש שלו דומה להתנהגות הכוללת של המערכת, ואחר שמבטא כמה עוצמתית היא השימוש ב‑GPU. אותות אלה משולבים באמצעות שני משקלים ניתנים לכוונון שניתן לכוון להדגיש התאמה מבנית או ביקוש גולמי. על ידי חיפוש בין שילובים רבים בעבר, המודל מוצא זוג משקלים שמתאימים ביותר לוקטור המדיניות. במבחנים על יומני המערכת של Neuron בקוריאה ומרכז מחשוב-על אמריקאי, התערובת הממוטבת נטתה להעדיף יותר את הביקוש אך עדיין העניקה משיכה משמעותית כלפי יעדי המדיניות. אומדן סטטי זה לבדו הפחית במידה ניכרת את הסטייה בין הקצאות רצויות לבין צפויות, אם כי חלק מהתחומים—כמו מדעי החומרים—נותרו חסרים במידה ניכרת.

Figure 2
Figure 2.

לולאת משוב חכמה לשיתוף בזמן אמת

כדי לצמצם פער זה, המחקר מוסיף שכבה שנייה: בקר דינמי שפועל בזמן שהמערכת רצה. הזמן מחולק לחלונות קצרים, ובכל אחד מהם הבקר בודק האם הביקוש של תחום חורג גם מנתח המדיניות שלו וגם ממה שההיסטוריה האחרונה שלו מצדיקה בתבונה. כשתחום מנסה להשתמש ביותר מהגבול העליון היעיל הזה, העודף מטופל כספקטרומטר שניתן להשיב. "פרוסות" ה‑GPU שמוחזרו כך מחולקות מחדש לתחומים הנמצאים מתחת ליעדיהם, בפרופורציה למידת החיסור שלהם. תהליך של הגבלה-וחלוקה חוזר על עצמו לאורך זמן, ויוצר לולאת משוב שמדרבנת בהדרגה את ההקצאות האמיתיות לכיוון וקטור המדיניות תוך שמירה על ניצול כמעט מלא של המכונה.

מה המבחנים אומרים על ביצועים ויציבות

סימולציות על שבוע של דפוסי ביקוש ריאליסטיים מראות שהגישה המשולבת הזאת מהדקת בצורה דרמטית את ההתאמה ליעדי המדיניות: שגיאת הקצאה ממוצעת יורדת מכ‑8% לכמעט 1%, ושיפור דומה מופיע במדד שגיאה מחמיר יותר. חשוב מכך, רווחים אלה לא באים על חשבון בזבוז קיבולת או תורים ארוכים יותר. ניצול ה‑GPU נשאר מעל 92%, התפוקה נשארת דומה למתזמנים סטנדרטיים וזמני ההמתנה אינם גדלים. מבחני עומס שבהם תחום אחד מנפח את הביקוש באופן מלאכותי—בין אם בקפיצה פתאומית או במשטח מתמשך—מראים שהבקר מתנגד להתנהגות אסטרטגית כזו, ומצמצם שגיאות בכ־40–45% בהשוואה לקו יסוד ללא בקר. בדיקות רגישות על פרמטרים מרכזיים מצביעות על כך שהתנהגות המערכת נשארת יציבה בטווח סביר של הגדרות.

מה משמעות הדבר לעתיד החישוב המשותף

במונחים יומיומיים, המאמר מראה שאינו חייבים לבחור בין מחשבי-על מהירים ויעילים לבין אסטרטגיה לאומית מתחשבת. על ידי הצפנת יעדי מדיניות כיעדים מספריים ברורים ושילובם בתכנון ובבקרה בזמן אמת, המסגרת המוצעת מציעה דרך להוביל את זמני ה‑GPU לתיק מאוזן של תחומי מדע מבלי להאט את המכונות או לטבוע חוקרים בבירוקרטיה. אף שהעבודה מוצגת בסימולציה על מערכת יחידה ומניחה וקטורי מדיניות קבועים, היא מצביעה לעתיד שבו מרכזי מחשוב לאומיים פועלים לא רק כמחשבים חזקים אלא גם ככלים מכוונים בקפידה של מדיניות מדע וטכנולוגיה.

ציטוט: Shim, H. Policy-aware GPU resource allocation for national supercomputing. Sci Rep 16, 12438 (2026). https://doi.org/10.1038/s41598-026-42625-6

מילות מפתח: תזמון GPU, מדיניות מחשוב-על, הקצאת משאבים, תשתית מדעית, חישוב ל- AI