Clear Sky Science · ru

WS-SSA: планирование рабочих процессов в облачных вычислениях с использованием алгоритма стаи сальп

2026-04-24 · Назад к списку

Почему важно умнее управлять цифровым трафиком

За каждой онлайн-картой, медицинским анализом или открытием гравитационных волн скрывается лабиринт вычислительных задач, которые нужно выполнить в правильном порядке, на подходящих машинах и как можно быстрее и дешевле. В современных облачных вычислениях эти задания разбиваются на тысячи взаимосвязанных шагов, распределённых по центрам обработки данных по всему миру. При неумелом управлении таким цифровым трафиком учёные получают ответы дольше, а провайдеры потребляют больше электроэнергии, чем требуется. В этой статье предложен новый способ оркестрации таких сложных рабочих процессов, вдохновлённый неожиданным источником: цепочками крошечных морских существ — сальп.

Как крупные научные задачи разбивают на фрагменты

Крупные научные и прикладные приложения редко выполняются как единая программа. Как правило, их декомпозируют на множество более мелких задач, зависящих друг от друга. Исследователи представляют эту структуру в виде ориентированного ациклического графа: узлы соответствуют задачам, а стрелки показывают, какие результаты должны быть получены прежде, чем начнутся последующие задачи. В облачном центре эти задачи сопоставляются виртуальным машинам — программным компьютерам, различающимся по скорости, объёму памяти и сетевым возможностям. Задача заключается в том, чтобы решить, какая задача на какой машине и когда должна выполняться, чтобы весь рабочий процесс завершился как можно быстрее при эффективном использовании ресурсов.

Почему найти лучший план так сложно

Выбор оптимального расписания для тысяч взаимозависимых задач на множестве различных машин является классическим примером так называемой NP-трудной задачи: число возможных назначений растёт так быстро, что перебор всех вариантов на практике невозможен. По этой причине облачные системы опираются на хитрые упрощения — эвристики и метаэвристики — чтобы найти хорошие, но не гарантированно идеальные решения. Традиционные правила, такие как «первым пришёл — первым обслужен» или круговая очередь, просты, но при больших масштабах неэффективны. Более продвинутые подходы, включая генетические алгоритмы, оптимизацию роя частиц и оптимизацию муравьиной колонии, ищут более интеллектуально, но всё ещё могут застрять в посредственных решениях, требовать тонкой настройки параметров или игнорировать важные зависимости между задачами.

Учимся у цепочек сальп в океане

Новый метод, называемый WS-SSA, адаптирует алгоритм стаи сальп к реалиям облачных рабочих процессов. В природе сальпы плавают в цепочках с лидером впереди и последователями позади, корректируя курс в поисках пищи. WS-SSA рассматривает каждый возможный план расписания как один элемент такой цепочки. Наилучший известный план выполняет роль «еды», направляя движение лидера, а последователи постепенно смещаются в сторону перспективных областей. Важная инженерная идея состоит в том, что каждая позиция в этой искусственной стае напрямую кодирует, на какой виртуальной машине выполняется каждая задача, используя простые целые числа вместо непрерывных значений, которые затем нужно преобразовывать. В сочетании с аккуратным упорядочением задач, которое всегда учитывает их зависимости, это гарантирует, что каждый кандидат-план, рассматриваемый стаей, является корректным и сразу пригодным для выполнения.

Испытание нового планировщика

Чтобы оценить эффективность WS-SSA, авторы провели обширные симуляции с использованием WorkflowSim — набора инструментов, моделирующего реальные научные рабочие процессы на базе широко используемой среды CloudSim. Были протестированы пять эталонных приложений из астрономии, сейсмологии, физики гравитационных волн и биоинформатики, с размерами рабочих процессов от нескольких десятков до тысячи задач и с конфигурациями облака от нескольких до сотни виртуальных машин. WS-SSA сравнивали с шестью классическими правилами планирования и тремя современными метаэвристическими методами, включая алгоритм оптимизации китов, генетические алгоритмы и оптимизацию роя частиц. Основной метрикой было суммарное время завершения (makespan), а в качестве тесно связанной вторичной меры отслеживалось общее энергопотребление виртуальных машин.

Что означают результаты для времени и энергии

В широком наборе экспериментов WS-SSA последовательно давал более быстрые расписания по сравнению с конкурентами. В среднем он сокращал makespan примерно на треть по сравнению с традиционными эвристиками и при этом обеспечивал выигрыш от нескольких до более чем двадцати процентов по отношению к хорошо зарекомендовавшим себя метаэвристикам. Поскольку время простоя и лишние вычисления также снижались, общее потребление энергии падало параллельно — часто на сопоставимые величины — без необходимости явной оптимизации под энергопотребление. Статистические тесты по 30 независимым прогонам подтвердили, что эти улучшения не случайны, особенно для более крупных и сложных рабочих процессов. Исследование показывает, что простая дискретная версия стратегии, вдохновлённой сальпами, надёжно ориентируется в огромном пространстве возможных расписаний и адаптируется к разным структурам рабочих процессов и конфигурациям машин.

Быстрее науке при меньших затратах энергии

Проще говоря, WS-SSA — это более умный регулятор трафика для цифровой магистрали, которая поддерживает современную науку и облачные сервисы. Координируя, когда и где выполняется каждая задача, он сокращает время между запуском сложной работы и получением итогового результата, одновременно снижая счёт за электроэнергию для дата-центров. Работа не меняет способ определения самих рабочих процессов; она предлагает более эффективный способ их выполнения на существующих облачных платформах. Будущие расширения, которые одновременно учтут стоимость, энергопотребление и сроки, могут сделать такие планировщики, вдохновлённые стаями, важным инструментом для более экологичной и отзывчивой вычислительной инфраструктуры.

Цитирование: Sharawy, A.A., Sakr, R.H., Eladrosy, W. et al. WS-SSA: workflow scheduling in cloud computing using salp swarm algorithm. Sci Rep 16, 13402 (2026). https://doi.org/10.1038/s41598-026-48037-w

Ключевые слова: планирование рабочих процессов в облаке, метаэвристическая оптимизация, алгоритм стаи сальп, научные вычисления, энергоэффективное облако