Clear Sky Science · nl

QLSA-MOEAD-integratie voor precieze taakplanning in heterogene rekenomgevingen

· Terug naar het overzicht

Waarom slimmer plannen op computers ertoe doet

Van aardbevingssimulaties tot ruimtetelescopen: de wetenschap van vandaag draait op uitgestrekte computersystemen die verschillende soorten chips combineren—traditionele CPU’s, grafische processors en herconfigureerbare hardware. Bepalen welke chip welk deel van het werk moet uitvoeren, en in welke volgorde, is verrassend complex en kan veel tijd en energie verspillen als het slecht wordt gedaan. Dit artikel presenteert een nieuwe manier om deze complexe werklasten te orkestreren, zodat grote taken sneller afgerond worden, de hardware beter wordt benut en in sommige gevallen minder energie wordt verbruikt.

Verschillende chips, verstrengelde taken

Moderne high-performance computers zijn “heterogeen”: ze combineren CPU’s, GPU’s, FPGA’s en andere versnellingskaarten, elk met eigen sterke punten. Wetenschappelijke en industriële toepassingen splitsen hun werk vaak in veel kleine taken die verbonden zijn door gegevensafhankelijkheden, waardoor er natuurlijk een Direct Acyclic Graph (DAG) ontstaat. Sommige taken moeten klaar zijn voordat andere kunnen starten, en taken kunnen sneller of langzamer lopen afhankelijk van de chip waarop ze worden uitgevoerd. De uitdaging is honderden onderling afhankelijke taken toe te wijzen aan een mix van processors zodat de totale voltooiingstijd kort is, de machines bezig blijven in plaats van idle, en—voor bepaalde workflows—het energieverbruik binnen de perken blijft. Wiskundig gezien is dit een NP-moeilijk probleem, wat betekent dat een brute-force zoekoplossing onpraktisch is voor realistische systemen.

Figure 1
Figure 1.

Waarom oudere methoden tekortschieten

Traditionele planningsbenaderingen veronderstellen vaak een stabiele omgeving en richten zich op één doel, zoals het minimaliseren van de voltooiingstijd. Bekende heuristieken zoals HEFT ordenen taken op prioriteit, terwijl metaheuristieken zoals simulated annealing of tabu search het vlak van mogelijke schema’s verkennen op zoek naar verbeteringen. Deze methoden kunnen goed werken op kleinere of eenvoudigere systemen, maar ze beginnen meestal met willekeurige beginschema’s, passen zich niet aan wanneer omstandigheden veranderen en worstelen met het tegelijk nastreven van meerdere doelen—zoals tijd, balans in hardwarebelasting en energie. Recente op machine learning gebaseerde planners voegen aanpassingsvermogen toe, maar vereisen doorgaans grote trainingsdatasets en missen nog een principiële manier om een volledige set afwegingsoplossingen voor meerdere doelstellingen te produceren.

Een hybride leerder die plant en verfijnt

De auteurs stellen QLSA-MOEAD voor, een hybride framework dat drie ideeën mengt: Q-learning, simulated annealing en een multi-objectieve evolutionaire techniek genaamd MOEA/D. Eerst wordt een Q-learning agent getraind om taakvolgordes op te bouwen door trial-and-error. De agent stelt herhaaldelijk schema’s samen, observeert hoe lang ze duren en werkt een tabel met “Q-waarden” bij die vastleggen welke keuzes doorgaans leiden tot betere uitkomsten. In plaats van te vertrouwen op vaste regels, leert de agent geleidelijk goede patronen voor het toewijzen van taken aan processors, inclusief hoe te reageren wanneer er tijdens uitvoering nieuwe taken verschijnen. Met dit geleerde beleid genereert het systeem een sterke initiële planning in plaats van een willekeurige, wat het optimalisatieproces een vliegende start geeft.

Fijnstelling en het balanceren van concurrerende doelen

Vervolgens verplaatst simulated annealing het geleerde schema door takenparen te ruilen en af en toe slechtere opties te accepteren om uit lokale doodlopende paden te ontsnappen, veelal vergelijkbaar met het schudden van een puzzel om in een betere configuratie te belanden. Ten slotte behandelt MOEA/D het planningsprobleem als echt multi-objectief. In plaats van alle doelen in één score samen te vouwen, decomposeert het het probleem in vele subproblemen, elk representatief voor een andere afweging tussen snel afronden en het gelijkmatig belasten van processors—en voor een seismische hazard-workflow genaamd CyberShake ook het verlagen van energiegebruik. Een evolutionair proces verkent deze afwegingen parallel en wisselt informatie uit tussen naburige subproblemen om een gevarieerde “Pareto-front” aan schema’s te produceren waarbij verbetering van het ene doel het andere zou verslechteren.

Figure 2
Figure 2.

De methode op de proef gesteld

Om de prestaties te beoordelen werd QLSA-MOEAD getest op 20 workflowgevallen, waaronder synthetische Fast Fourier Transform- en moleculaire workloads, een grote astronomische beeld-stitcing workflow (Montage) en de realistische CyberShake-aardbevingssimulatie. In 16 synthetische gevallen leverde de nieuwe methode in 14 keer de beste oplossingskwaliteit, met kortere voltooiingstijden en verbeterde hardwarebenutting vergeleken met meerdere geavanceerde referenties. Voor CyberShake, waar ook energie werd geoptimaliseerd, behaalde het twee- tot viermaal betere resultaten in een standaard multi-objectieve kwaliteitsmaatstaf dan de vorige state-of-the-art, terwijl het een goede spreiding van afwegingsoplossingen behield. In dynamische tests waarin nieuwe taken tijdens uitvoering binnenkomen, kon de geleerde planner reageren binnen twee milliseconden en plannen veel sneller aanpassen dan alles opnieuw berekenen, hoewel soms ten koste van optimale kwaliteit wanneer communicatievertragingen extreem waren.

Wat dit betekent voor alledaags rekenen

Voor een niet-specialist is de boodschap dat slimere, leer-gebaseerde planners grote, gemengde-chip computers zowel sneller als groener kunnen maken zonder voortdurend handmatig bijsturen. Door een ervaringsgebaseerde planner (Q-learning), een grondige lokale zoekmethode (simulated annealing) en een verkenner van afwegingen (MOEA/D) te combineren, vindt het voorgestelde framework consequent schema’s die grote taken eerder afronden, dure hardware beter benutten en voor sommige toepassingen het energieverbruik verlagen. Hoewel er nog beperkingen zijn—zoals trainingskosten en prestatieverlies in de meest extreme omstandigheden—laat de studie een praktisch pad zien richting meer autonome, efficiënte orkestratie van complexe wetenschappelijke en industriële workflows.

Bronvermelding: Saad, A., Abd el-Raouf, O., Hadhoud, M. et al. QLSA-MOEAD integration for precision task scheduling in heterogeneous computing environments. Sci Rep 16, 7194 (2026). https://doi.org/10.1038/s41598-026-36916-1

Trefwoorden: taakplanning, heterogene computing, versterkend leren, multi-objectieve optimalisatie, energiezuinige workflows