Clear Sky Science · pl

Integracja QLSA-MOEAD dla precyzyjnego planowania zadań w heterogenicznych środowiskach obliczeniowych

· Powrót do spisu

Dlaczego inteligentniejsze planowanie komputerowe ma znaczenie

Od symulacji trzęsień ziemi po teleskopy kosmiczne — współczesna nauka działa na rozległych systemach komputerowych łączących różne typy układów: klasyczne procesory, procesory graficzne i sprzęt rekonfigurowalny. Decydowanie, który układ powinien wykonać które zadanie i w jakiej kolejności, jest zaskakująco trudne i w przypadku złych decyzji może marnować czas oraz energię. W artykule przedstawiono nowy sposób orkiestracji takich złożonych obciążeń, dzięki któremu duże zadania kończą się szybciej, sprzęt jest lepiej wykorzystany, a w niektórych przypadkach zużycie energii spada.

Różne układy, splątane zadania

Nowoczesne superkomputery są „heterogeniczne”: łączą CPU, GPU, FPGA i inne akceleratory, z których każdy ma inne zalety. Zastosowania naukowe i przemysłowe często dzielą pracę na wiele małych zadań powiązanych zależnościami danych, tworząc naturalnie skierowany acykliczny graf (DAG). Niektóre zadania muszą się zakończyć, zanim inne się rozpoczną, a ich czas wykonania zależy od typu użytego układu. Wyzwaniem jest przypisanie setek wzajemnie zależnych zadań do mieszanki procesorów tak, by łączny czas wykonania był krótki, maszyny były zajęte zamiast bezczynne, a dla określonych przepływów pracy zużycie energii pozostawało pod kontrolą. Matematycznie jest to problem NP-zupełny, co oznacza, że przeszukiwanie siłowe jest niepraktyczne dla realistycznych systemów.

Figure 1
Figure 1.

Dlaczego starsze metody zawodzą

Tradycyjne podejścia do planowania często zakładają stabilne środowisko i koncentrują się na jednym celu, na przykład minimalizacji czasu zakończenia. Znane heurystyki, takie jak HEFT, porządkują zadania według priorytetu, podczas gdy metaheurystyki takie jak symulowane wyżarzanie czy przeszukiwanie tabu eksplorują przestrzeń możliwych harmonogramów w poszukiwaniu ulepszeń. Metody te radzą sobie dobrze w mniejszych lub prostszych systemach, lecz zazwyczaj zaczynają od losowych harmonogramów, nie przystosowują się, gdy warunki się zmieniają, i mają trudności z jednoczesnym godzeniem kilku celów — np. czasu, równomiernego obciążenia sprzętu i zużycia energii. Nowsze planery oparte na uczeniu maszynowym dodają adaptacyjność, ale zwykle wymagają dużych zbiorów treningowych i wciąż brakuje im ugruntowanego sposobu na wygenerowanie pełnego zbioru rozwiązań kompromisowych dla wielu celów.

Hybrydowy uczący się system, który planuje i dopracowuje

Autorzy proponują QLSA-MOEAD — hybrydowe ramy łączące trzy idee: Q-learning, symulowane wyżarzanie oraz wielokryterialną technikę ewolucyjną MOEA/D. Najpierw agent Q-learning jest trenowany do konstruowania porządków zadań metodą prób i błędów. Wielokrotnie tworzy harmonogramy, obserwuje ich czas wykonania i aktualizuje tabelę „wartości Q”, które odzwierciedlają, które wybory prowadzą do lepszych wyników. Zamiast polegać na stałych regułach, agent stopniowo uczy się dobrych wzorców mapowania zadań na procesory, w tym jak reagować, gdy w czasie wykonania pojawiają się nowe zadania. Korzystając z tej wyuczonej polityki, system generuje silny harmonogram początkowy zamiast losowego, dając procesowi optymalizacji przewagę na starcie.

Dostrajanie i równoważenie konkurujących celów

Następnie symulowane wyżarzanie delikatnie modyfikuje wyuczony harmonogram przez zamiany par zadań i okazjonalne akceptowanie gorszych opcji, aby uciec z lokalnych minimów — podobnie jak potrząsanie układanką pomaga znaleźć lepsze ułożenie. Wreszcie MOEA/D traktuje problem planowania jako prawdziwie wielokryterialny. Zamiast redukować wszystkie cele do jednej miary, dekomponuje problem na wiele podproblemów, z których każdy reprezentuje inny kompromis między szybkim zakończeniem a równomiernym obciążeniem procesorów — a w przypadku przepływu pracy dotyczącego zagrożeń sejsmicznych, CyberShake, także redukcję zużycia energii. Proces ewolucyjny równolegle bada te kompromisy, wymieniając informacje między sąsiednimi podproblemami, by wygenerować zróżnicowany „front Pareto” harmonogramów, w którym poprawa jednego celu pogorszyłaby inny.

Figure 2
Figure 2.

Testowanie metody

Aby ocenić wydajność, QLSA-MOEAD przetestowano na 20 przypadkach przepływów pracy, w tym syntetycznych obciążeniach FFT i molekularnych, dużym astronomicznym przepływie łączenia obrazów (Montage) oraz rzeczywistej symulacji trzęsień ziemi CyberShake. Wśród 16 przypadków syntetycznych nowa metoda dostarczyła najlepszą jakość rozwiązania w 14, skracając czasy wykonania i poprawiając wykorzystanie sprzętu w porównaniu z kilkoma zaawansowanymi metodami bazowymi. Dla CyberShake, gdzie optymalizowano także energię, osiągnęła dwukrotne do czterokrotne poprawy w standardowym wielokryterialnym mierniku jakości względem wcześniejszego stanu wiedzy, zachowując przy tym dobrą rozpiętość rozwiązań kompromisowych. W testach dynamicznych, gdy nowe zadania pojawiały się w locie, wyuczony planer potrafił zareagować w czasie poniżej dwóch milisekund, dostosowując plany znacznie szybciej niż ponowne przeliczanie wszystkiego od zera, choć czasem kosztem pogorszenia optymalności przy skrajnych opóźnieniach komunikacji.

Co to oznacza dla codziennych obliczeń

Dla odbiorcy niezajmującego się specjalistycznie przekaz jest taki: inteligentniejsze, oparte na uczeniu planery mogą sprawić, że duże, mieszane systemy obliczeniowe będą zarówno szybsze, jak i bardziej energooszczędne bez ciągłej ręcznej konfiguracji. Łącząc planera opartego na doświadczeniu (Q-learning), staranne przeszukiwanie lokalne (symulowane wyżarzanie) oraz eksplorator kompromisów (MOEA/D), proponowane ramy konsekwentnie znajdują harmonogramy, które szybciej kończą duże zadania, lepiej wykorzystują kosztowny sprzęt, a w niektórych zastosowaniach obniżają zużycie energii. Choć wciąż istnieją ograniczenia — takie jak koszt treningu i spadki wydajności w najbardziej ekstremalnych warunkach — badanie pokazuje praktyczną drogę ku bardziej autonomicznej, efektywnej orkiestracji złożonych przepływów pracy w nauce i przemyśle.

Cytowanie: Saad, A., Abd el-Raouf, O., Hadhoud, M. et al. QLSA-MOEAD integration for precision task scheduling in heterogeneous computing environments. Sci Rep 16, 7194 (2026). https://doi.org/10.1038/s41598-026-36916-1

Słowa kluczowe: planowanie zadań, heterogeniczne obliczenia, uczenie przez wzmacnianie, optymalizacja wielokryterialna, energooszczędne przepływy pracy