Clear Sky Science · he

אינטגרציה של QLSA-MOEAD לתזמון משימות מדויק בסביבות חישוב הטרוגניות

· חזרה לאינדקס

למה תזמון חכם יותר של המחשב חשוב

מדימות רעידות אדמה עד טלסקופים בחלל — המדע של היום רץ על מערכות מחשב רחבות שמערבות סוגים שונים של שבבים: מעבדי CPU מסורתיים, מעבדי גרפיקה וחומרה הניתנת להתאמה. ההחלטה איזה שבב יריץ איזה חלק עבודה ובאיזה סדר היא מפתיעה קשה ועלולה לבזבז זמן ואנרגיה אם נעשית לא נכון. מאמר זה מציג שיטה חדשה לארגון עומסי עבודה מורכבים אלה כך שעבודות גדולות יסתיימו מהר יותר, ינוצל החומרה ביתר יעילות ובמקרים מסוימים תצרוכת החשמל תפחת.

שבבים שונים, משימות מסובכות

מחשבים ביצועים מודרניים הם "הטרוגניים": הם משלבים CPUs, GPUs, FPGAs ומאיצים אחרים, כל אחד עם חוזקות שונות. יישומים מדעיים ותעשייתיים מפרקים לעיתים קרובות את עבודתם לריבוי משימות קטנות שמקושרות בתלותי נתונים, ולכן יוצרות באופן טבעי גרף מכוון ללא מעגלים (DAG). יש משימות שחייבות להסתיים לפני שאחרות יכולות להתחיל, ומשימות עשויות לרוץ מהר או לאט בהתאם לשבב שעליו הן מורצות. האתגר הוא להקצות מאות משימות תלויות זו בזו לתערובת מעבדים כך שזמן הסיום הכולל יהיה קצר, המכונות יישארו מועסקות במקום להשאר חסרות תעסוקה, ובזרמי עבודה מסוימים גם צריכת האנרגיה תשמר תחת שליטה. באופן מתמטי, מדובר בבעיה NP-קשה, כלומר חיפוש בכוח גס אינו ישים במערכות ברות-מציאות.

Figure 1
Figure 1.

למה שיטות ישנות לא מספיקות

גישות תזמון מסורתיות נוטות להניח סביבת עבודה יציבה ומתמקדות במטרה אחת, כמו הקטנת משך הסיום. אלגוריתמים ידועים כגון HEFT ממקמים משימות לפי עדיפות, בעוד מטא־היוריסטיקות כמו annealing מדומה או חיפוש טאבואי מטיילות במרחב האפשרויות בחיפוש שיפורים. שיטות אלה יכולות לעבוד היטב במערכות קטנות או פשוטות, אך בדרך כלל מתחילות מתזמונים אקראיים, אינן מסתגלות כאשר התנאים משתנים, ומתמודדות קשה עם איזון בין מטרות מרובות — כמו זמן, איזון עומס החומרה ואנרגיה. מתזמנים מבוססי־למידת מכונה הוסיפו מסתגלות, אך לרוב דורשים מערכי אימון גדולים ועדיין חסרים דרך עקרונית לייצר סט מלא של פתרונות פשרה רב־מטריים.

לומד היברידי שמתכנן ומחדד

המחברים מציעים את QLSA-MOEAD, מסגרת היברידית שמשלבת שלוש רעיונות: Q-learning, annealing מדומה וטכניקת אבולוציה רב־מטרית בשם MOEA/D. ראשית, סוכן Q-learning מאומן לבנות סדרי משימות בניסיון וטעייה. הסוכן בונה תזמונים שוב ושוב, מתבונן במשך זמן הריצה שלהם ומעדכן טבלת "ערכי Q" שתופסת אילו בחירות נוטות להוביל לתוצאות טובות יותר. במקום להסתמך על כללים נוקשים, הסוכן לומד בהדרגה דפוסים טובים למיפוי משימות למעבדים, כולל איך להגיב כאשר משימות חדשות מופיעות בזמן הריצה. באמצעות מדיניות זו שלמדו, המערכת יוצרת תזמון התחלתי חזק במקום תזמון אקראי, ומעניקה תזוזת יתר לתהליך האופטימיזציה.

כיוונון ואיזון מטרות מתחרות

לאחר מכן, annealing מדומה מלטש את התזמון הנלמד על ידי החלפת זוגות משימות וקבלה לפעמים של אופציות גרועות יותר כדי לברוח מלבנים מקומיים, בדמיון לטלטול פאזל כדי להתמקם בתצורה טובה יותר. לבסוף, MOEA/D מתייחס לבעיה כבריבּת־מטרות אמיתית. במקום לצמצם את כל המטרות לציון יחיד, היא מפרקת את הבעיה לתת־בעיות רבות, כל אחת מייצגת פשרה שונה בין סיום מהיר ושמירה על עומס מאוזן במעבדים — ובמקרה של זרימת עבודה לבחינת סכנות סייסמיות בשם CyberShake, גם הפחתת צריכת אנרגיה. תהליך אבולוציוני חוקר את הפשרות האלה במקביל, מחליף מידע בין תת־בעיות שכנות ומפיק "חזית פרטו" מגוונת של תזמונים שבה שיפור במטרה אחת יפגע באחרת.

Figure 2
Figure 2.

בחינת השיטה במבחן

כדי להעריך ביצועים, QLSA-MOEAD נבדקה על 20 מקרים של זרמי עבודה, כולל עומסי עבודה סינתטיים של מהירויות טרנספורמציית פורייה ומולקולות, זרם עבודה גדול להרכבת תמונות אסטרונומיות (Montage) והדוגמה המעשית CyberShake לדימות רעידות אדמה. ב־16 מקרים סינתטיים, השיטה החדשה סיפקה את איכות הפתרון הטובה ביותר ב־14 מהם, קיצרה זמנים ושיפרה את ניצול החומרה בהשוואה למספר בסיסי מתקדמים. עבור CyberShake, שם גם אופטימיזציה של אנרגיה נלקחה בחשבון, הושגו שיפורים של פי שניים עד פי ארבע בציון איכות רב־מטרי סטנדרטי ביחס למצב האמנותי הקודם, תוך שמירה על פיזור טוב של פתרונות פשרה. במבחנים דינמיים שבהם משימות חדשות מגיעות במהלך הריצה, המתזמן הנלמד יכול להגיב בפחות משתי מילישניות, ומתאים תכניות מהר בהרבה מאשר חישוב מחדש מהבסיס — אם כי לעיתים במחיר של ירידת אופטימליות כאשר עיכובי תקשורת קיצוניים מתרחשים.

מה המשמעות לכך בחישוב יומיומי

ללא צורך בבקיאות מיוחדת, המסר הוא שמתזמנים חכמים מבוססי־למידה יכולים להפוך מחשבים גדולים מעורבי־שבבים למהירים וירוקים יותר בלי כוונון ידני מתמשך. בשילוב מתכנן מבוסס־ניסיון (Q-learning), חיפוש מקומי זהיר (annealing מדומה) וחוקר פשרות (MOEA/D), המסגרת המוצעת מוצאת בעקביות תזמונים שמסיימים עבודות גדולות מהר יותר, שומרת על ניצול טוב יותר של חומרה יקרה ובחלק מהיישומים מפחיתה צריכת אנרגיה. למרות שעדיין קיימים מגבלות — כגון עלות האימון וירידות ביצועים בתנאים הקיצוניים ביותר — המחקר מצביע על נתיב מעשי לעבר ארגון אוטונומי ויעיל יותר של זרמי עבודה מדעיים ותעשייתיים מורכבים.

ציטוט: Saad, A., Abd el-Raouf, O., Hadhoud, M. et al. QLSA-MOEAD integration for precision task scheduling in heterogeneous computing environments. Sci Rep 16, 7194 (2026). https://doi.org/10.1038/s41598-026-36916-1

מילות מפתח: תזמון משימות, חישוב הטרוגני, למידת חיזוק, אופטימיזציה רב-מטרית, זרמי עבודה חסכוניים באנרגיה