Clear Sky Science · ru

IntelliScheduler: гибридная глубокая обучающая框架 для распределения задач в гибридной среде edge–cloud на основе обучения

· Назад к списку

Почему ожидание облака по‑прежнему имеет значение

Каждый раз, когда умная камера отмечает незнакомца у вашей двери или подключённый автомобиль реагирует на дорожную ситуацию, она отправляет небольшие задания — «таски» — на обработку где‑то в интернете. Если эти задания всегда идут в удалённые дата‑центры, круговой маршрут может оказаться слишком долгим для действий с жёсткими временными требованиями. В этой статье представлен IntelliScheduler — система на основе обучения, которая в реальном времени решает, какие задачи следует обрабатывать близко к пользователю на границе сети (edge), а какие можно безопасно отправлять в облако, стремясь сохранить быструю реакцию при контроле издержек.

От далёких серверов к ближайшим помощникам

Традиционная облачная обработка долгое время была главным инструментом для онлайн‑сервисов благодаря экономии при масштабировании на миллионы пользователей. Но для многих современных применений Интернета вещей (IoT) — например, промышленных датчиков, умных автомобилей или носимой медицины — каждая дополнительная миллисекунда задержки имеет значение. Чтобы сократить эту задержку, компании располагают небольшие серверы ближе к пользователям — так называемые edge‑серверы. Эти машины отвечают быстрее, но имеют ограничённую ёмкость. Если слишком много задач направлять на edge, они встают в очередь; если слишком много отправлять в облако, узким местом становится время передачи. Старые методы планирования опирались на фиксированные правила или вручную составленные эвристики, которые часто дают сбой при всплесках нагрузки или резких изменениях сети.

Figure 1
Figure 1.

Мозг, который решает, куда направить работу

Авторы предлагают IntelliScheduler — фреймворк, который рассматривает размещение задач в системе edge–cloud как задачу обучения, а не набор жёстких правил. В его основе лежит форма глубокого обучения с подкреплением: искусственный агент наблюдает за текущим состоянием системы — насколько загружены edge‑ и облачные машины, длины их очередей, срочность входящих задач — и затем выбирает действие, например отправить задачу на edge, в облако или распределить работу между ними. После каждого решения агент получает обратную связь, в основном основанную на том, сколько времени устройства ждали и были ли нарушены сроки обслуживания. За многочисленные циклы проб и ошибок система постепенно вырабатывает политику, минимизирующую время ожидания и сохраняющую соглашения об уровне обслуживания.

Запоминание разных типов загруженных дней

Ключевая инновация — способ, которым IntelliScheduler учится на опыте. Вместо хранения прошлых ситуаций и решений в одном длинном списке система поддерживает несколько отдельных буферов памяти. Каждый буфер собирает примеры из разных рабочих условий — например, при лёгкой нагрузке, сильной перегрузке или при неравномерном использовании edge. При обучении агент выборочно извлекает примеры из всех этих буферов, отдавая приоритет тем опытам, где его предыдущие предсказания были наиболее ошибочны. Этот многобуферный дизайн помогает обучению оставаться стабильным при изменениях окружающей среды, предотвращая колебания, которые возникают, когда модель постоянно переобучается только на самых недавних событиях. Математическая модель, лежащая в основе подхода, явно учитывает три способа обработки задачи: полностью в облаке, полностью на edge или гибридно, когда обработка мигрирует с edge в облако при нехватке ресурсов.

Проверка фреймворка

Чтобы изучить поведение IntelliScheduler, исследователи построили детализированный симулятор системы edge–cloud, обрабатывающей рабочие процессы IoT. Они сравнили свой алгоритм Learning‑based Optimal Task Scheduling (LbOTS) с тремя популярными планировщиками на основе оптимизации из области ройной интеллекта и метаэвристик. На малых, средних и больших синтетических нагрузках — вплоть до миллиона заданий — подход на основе обучения стабильно давал более высокую суммарную награду, которая сочетает в себе сокращение ожидания и лучшее соблюдение сроков. Обучение проходило надёжнее, с потерями обучения до двух третей ниже, а использование ресурсов было эффективнее: ориентировочные операционные расходы сократились примерно вдвое или больше. Возможно, самое впечатляющее — доля отклонённых задач из‑за перегрузки упала примерно на 80–90 %, а воспринимаемое пользователем качество работы улучшилось примерно на 15–75 % по сравнению с конкурирующими подходами.

Figure 2
Figure 2.

Что это значит для повседневных подключённых устройств

Практически это исследование показывает, что адаптивный агент‑«диспетчер» для цифровых задач на основе обучения может сделать системы edge–cloud более отзывчивыми и экономичными по сравнению со статичными правилами планирования. IntelliScheduler демонстрирует, что непрерывный мониторинг загрузки серверов и сетей и обучение на широком наборе прошлых условий позволяют автоматическому агенту поддерживать критичные по времени IoT‑приложения с меньшим количеством потерянных запросов. Хотя текущие результаты получены в контролируемых симуляциях и в основном фокусируются на задержке и стоимости, а не на энергопотреблении или безопасности, архитектура спроектирована для расширения. По мере перехода таких систем от симуляций к реальным развёртываниям они могут помочь сделать растущую сеть умных устройств быстрее, надёжнее и менее расточительной за кулисами.

Цитирование: Raju, L.R., Reddy, M.V.K., Surukanti, S.R. et al. IntelliScheduler: an edge-cloud computing environment hybrid deep learning framework for task scheduling based on learning. Sci Rep 16, 11219 (2026). https://doi.org/10.1038/s41598-026-41330-8

Ключевые слова: edge computing, cloud computing, task scheduling, reinforcement learning, Internet of Things