Clear Sky Science · ru

Оптимизация расписания с учётом энергии в беспроводных сенсорных сетях (WSN) с использованием гибридного био-вдохновлённого подхода на основе обучения с подкреплением

2026-03-11 · Назад к списку

Более умные датчики для связанного мира

От полей и ферм до заводских цехов — беспроводные датчики незаметно следят за нашими энергосетями, посевами, мостами и даже зонами бедствий. Но есть проблема: эти крошечные устройства работают от маленьких батарей и часто расположены в труднодоступных местах. Замена разряженных батарей у тысяч датчиков дорогая или практически невозможная. В этой работе рассматривается новый способ решения, какие датчики должны быть активны, а какие можно безопасно усыпить, чтобы сеть служила дольше, оставалась надёжной и потребляла как можно меньше энергии.

Проблема круглосуточного мониторинга

Беспроводные сенсорные сети похожи на невидимые одеяла, покрывающие территорию, измеряя температуру, движение, загрязнение или другие сигналы и отправляя их на базовую станцию. Если каждый датчик постоянно включён, одеяло густое, но недолговечное: батареи быстро садятся, и сеть умирает раньше времени. Если слишком много датчиков отключить, покрытие становится неполным, и сообщения могут перестать доходить до базовой станции. Главная задача — держать активными ровно столько датчиков, сколько нужно, в нужных местах и в нужное время, чтобы поддерживать хорошее покрытие и связность, одновременно максимально продлевая срок службы батарей.

Учимся у муравьёв, птиц и собственного опыта

Исследователи давно заимствуют идеи из природы для решения подобных задач. Муравьино-подобные методы посылают виртуальных «муравьёв» по сети, постепенно укрепляя хорошие маршруты так же, как реальные муравьи оставляют феромоны. Птице-подобные методы рассматривают каждую возможную конфигурацию активных датчиков как «частицу» в стае, которая со временем движется к лучшим решениям. Эти подходы работают во многих сценариях, но испытывают трудности, когда сеть меняется — когда батареи садятся, датчики выходят из строя или меняется топология. Они склонны следовать фиксированным правилам и не могут легко адаптироваться, когда среда отклоняется от тех условий, на которые они были настроены.

Гибридный «мозг», переключающий стратегии

Авторы предлагают гибридный подход под названием RL-HAPSO, который вносит новую идею: он не только использует муравьиный и птицеподобный поиск, но и учится, когда обращаться к каждому из них. В офлайн-фазе одна часть системы выбирает набор энергоэффективных датчиков для активации, в то время как другая перестраивает распределение работы между активными датчиками, чтобы уменьшить избыточность и сохранить покрытие. Поверх этого модуль обучения отслеживает состояние сети — насколько большая часть территории покрыта, сколько осталось энергии и какая избыточность присутствует. Исходя из этой сводки, он на каждом шаге расписания решает, полагаться ли преимущественно на муравьиный поиск, на птицеподобную доработку или на комбинированный гибрид. Со временем этот мета-уровневый обучающийся обнаруживает, какой выбор чаще всего работает лучше в разных условиях.

Проверка системы на практике

Чтобы выяснить, является ли этот обучаемый планировщик чем-то большим, чем элегантная идея, команда провела обширные симуляции на сетях с разной топологией: случайно разбросанные датчики, упорядоченные решётки и кластерные группы, имитирующие реальные развёртывания. Они сравнили чисто муравьиный метод, чисто птицеподобный, фиксированный гибрид обоих и их новый гибрид с обучением. Измерялись энергопотребление каждого метода, качество покрытия территории, скорость сходимости к устойчивому шаблону и стабильность результатов при множественных повторных запусках. Метод с обучением не только находил хорошие решения быстрее, но и обеспечивал меньшую общую стоимость — то есть лучшее покрытие при меньших потерях энергии — при этом поддерживая стабильную работу даже по мере отказов узлов или падения уровней энергии.

Что это значит для повседневных технологий

Проще говоря, исследование показывает, что беспроводные сенсорные сети могут управлять собой более разумно, рассматривая собственные правила расписания как то, чему можно учиться, а не как заранее фиксированное. RL-HAPSO действует как умный дирижёр невидимого оркестра датчиков, решая, какие «инструменты» должны звучать, а какие могут отдохнуть, и даже какой стиль принятия решений лучше в данный момент. Это позволяет сетям датчиков дольше работать, реагировать на меняющиеся условия и при этом предоставлять надёжные данные для приложений, таких как умное сельское хозяйство, мониторинг критической инфраструктуры и аварийные службы. По мере расширения Интернета вещей подобные подходы указывают путь к системам датчиков, которые не просто связаны, а действительно адаптивны и экономно расходуют ресурсы.

Цитирование: Sarobin, M.V.R., Akil, S., Shalu, S.B. et al. Energy optimized scheduling in wireless sensor networks (WSNs) using hybrid bio-inspired reinforcement learning approach. Sci Rep 16, 13109 (2026). https://doi.org/10.1038/s41598-026-35077-5

Ключевые слова: беспроводные сенсорные сети, энергоэффективное расписание, обучение с подкреплением, био-вдохновлённая оптимизация, Интернет вещей