Clear Sky Science · ja

異種コンピューティング環境における精密なタスクスケジューリングのためのQLSA-MOEAD統合

2026-02-17 · 一覧に戻る

より賢いコンピュータスケジューリングが重要な理由

地震シミュレーションから宇宙望遠鏡まで、現代の科学は伝統的なCPU、グラフィックスプロセッサ、再構成可能ハードウェアなど多様なチップを混在させた大規模な計算システムに依存しています。どのチップでどの作業を、どの順番で実行するかを決めるのは意外に難しく、下手に行うと時間やエネルギーを浪費します。本論文は、こうした複雑なワークロードを調整して、大きなジョブの完了を速め、ハードウェアの利用を高め、場合によっては消費電力を削減する新しい手法を提示します。

異なるチップと絡み合うジョブ

現代の高性能計算機は「異種」的です。CPU、GPU、FPGA、その他のアクセラレータを組み合わせ、それぞれに異なる強みがあります。科学的・産業的アプリケーションはしばしば作業を多数の小さなタスクに分割し、データ依存を通じて有向非巡回グラフ（DAG）を形成します。あるタスクが終わらないと次が開始できない場合があり、タスクは割り当てられるチップによって実行速度が変わります。課題は、数百に及ぶ相互依存タスクを混合したプロセッサ群に割り当て、全体の完了時間を短くし、機械を遊ばせず稼働させ、特定のワークフローではエネルギー使用も抑えることです。数学的にはこれはNP困難な問題であり、現実的な規模では総当たり探索は実用的ではありません。

従来手法が不足する理由

従来のスケジューリング手法はしばしば環境が安定していることを仮定し、完了時間の最小化など単一の目的に焦点を当てます。HEFTのような既知のヒューリスティックはタスクを優先度順に並べ、焼きなまし法やタブーサーチのようなメタヒューリスティックは改善を求めてスケジュール空間を探索します。これらは小規模または単純なシステムでは有効ですが、通常はランダムな初期スケジュールから始まり、状況変化に適応せず、時間・負荷バランス・エネルギーといった複数の目標を同時に扱うのが苦手です。近年の機械学習ベースのスケジューラは適応性を加えますが、多くは大量の学習データを必要とし、複数目的に対する全体のトレードオフ解集合を生成する確立された手法を持ちません。

計画し、洗練するハイブリッド学習者

著者らはQLSA-MOEADというハイブリッドフレームワークを提案します。これは3つの考え方――Q学習、焼きなまし法、そしてMOEA/Dと呼ばれる多目的進化的手法――を組み合わせたものです。まず、Q学習エージェントが試行錯誤を通じてタスクの順序付けを学習します。エージェントは何度もスケジュールを構築し、その完了時間を観察して、どの選択がより良い結果につながるかを表す“Q値”の表を更新します。固定ルールに頼る代わりに、エージェントはタスクをプロセッサに割り当てるための良いパターンや、実行中に新しいタスクが現れたときの反応方法を徐々に学びます。この学習された方策を用いることで、システムはランダムな初期案ではなく強力な初期スケジュールを生成し、最適化プロセスに先行優位を与えます。

微調整と競合する目的のバランス

次に、焼きなまし法が学習されたスケジュールを微調整します。タスクのペアを入れ替え、局所的な行き詰まりから抜け出すため時には悪化する選択を受け入れることで、より良い構成に落ち着くように“揺らす”操作を行います。最後にMOEA/Dはスケジューリング問題を真に多目的として扱います。全ての目的を単一のスコアにまとめる代わりに、完了時間の短縮とプロセッサの負荷均衡、そして地震ハザードワークフローであるCyberShakeのような場合にはエネルギー低減という相反する目的の異なるトレードオフを表す多くの部分問題に分解します。進化的プロセスがこれらのトレードオフを並列に探索し、隣接する部分問題間で情報を交換することで、一方を改善すれば他方が悪化する多様な“パレートフロント”となるスケジュール群を生成します。

手法の検証

性能評価のために、QLSA-MOEADはFFTや分子ワークロードといった合成ケース、大規模な天文画像合成ワークフロー（Montage）、および実世界の地震シミュレーションであるCyberShakeを含む20のワークフローケースでテストされました。16の合成ケースでは、新手法は14件で最良の解品質を示し、完了時間の短縮とハードウェア利用率の向上を複数の先進的ベースラインと比べて達成しました。エネルギーも最適化対象としたCyberShakeでは、従来最先端法に比べ標準的な多目的品質指標で2〜4倍の改善を達成し、トレードオフ解の分散（スプレッド）も良好に保ちました。実行中に新しいタスクが随時到着する動的なテストでは、学習済みスケジューラが2ミリ秒未満で反応し、すべてを再計算するよりはるかに速く計画を調整できましたが、通信遅延が極端な場合には最適性が低下することもありました。

日常の計算にとっての意味

専門外の読者向けに言えば、本研究は、学習ベースの賢いスケジューラが大規模で混在するチップ構成のコンピュータを、継続的な人手による調整なしにより高速かつ環境負荷を低く動かせる可能性を示しています。経験に基づく計画者（Q学習）、注意深い局所探索（焼きなまし法）、およびトレードオフ探索者（MOEA/D）を組み合わせることで、提案フレームワークは一貫して大きなジョブをより早く終わらせ、高価なハードウェアの利用効率を高め、応用によってはエネルギー消費を削減するスケジュールを見つけ出します。学習コストや極端な条件での性能低下といった限界は残るものの、本研究は複雑な科学的・産業的ワークフローのより自律的で効率的な調整に向けた実用的な道筋を示しています。

引用: Saad, A., Abd el-Raouf, O., Hadhoud, M. et al. QLSA-MOEAD integration for precision task scheduling in heterogeneous computing environments. Sci Rep 16, 7194 (2026). https://doi.org/10.1038/s41598-026-36916-1

キーワード: タスクスケジューリング, 異種コンピューティング, 強化学習, 多目的最適化, 省エネルギーなワークフロー