Clear Sky Science · ru

Оптимизация энергии в беспроводных сетях питания с помощью DQN

2026-02-09 · Назад к списку

Питание крошечных устройств через воздух

От умных фонарей до пожарных датчиков, спрятанных в лесах, бесчисленные крошечные устройства сейчас составляют Интернет вещей. Обеспечивать их энергией — серьёзная проблема: батареи разряжаются, а прокладывать провода повсюду непрактично. В этой работе рассматривают способ беспроводной передачи энергии таким устройствам и применение искусственного интеллекта для разумного распределения этой энергии, чтобы критически важные сенсоры работали дольше, а вся сеть функционировала более гладко.

Почему беспроводной энергетике нужен более умный контроль

Беспроводные сети с питанием передают радиоволны, которые устройства могут преобразовывать в электричество, одновременно используя их для передачи данных. В большинстве ранних работ преобразование энергии рассматривали как простое, линейное: больше сигнала — пропорционально больше энергии. На самом деле в схемах сбора энергии при сильном входном сигнале начинается «плато», и часть потенциала теряется. К тому же реальные условия шумные: освещённость для солнечных панелей меняется, здания экранируют сигналы, а внезапные события, например пожары, могут вызвать срочную потребность в передаче данных отдельными узлами. Статические правила, игнорирующие эти особенности, могут привести к голоданию энергии у одних сенсоров и её перерасходу у других, сокращая общую продолжительность жизни сети.

Обучающийся «мозг» для энергетической сети

Чтобы справиться с этим, авторы разрабатывают контроллер на основе обучения — Deep Q-Networks, формы обучения с подкреплением. Вместо опоры на фиксированные формулы контроллер рассматривает сеть как игру, разворачивающуюся во времени. В каждом раунде он наблюдает энергию в каждом узле, качество радиолиний и срочность задач — например мониторинг пожаров против рутинных измерений температуры. На основе этих наблюдений он решает, сколько энергии направить каждому узлу. После каждого решения он получает обратную связь, сочетающую несколько целей: передать как можно больше полезных данных, справедливо распределять энергию, чтобы ни одно устройство не оставалось постоянно без ресурсов, и избегать расточительного использования общего источника. За многие раунды контроллер учится, какие шаблоны распределения энергии дают наилучшие долгосрочные результаты.

Предвидение и балансировка конкурирующих целей

Ключевой элемент в системе — прогнозирование. Система использует статистический метод Gaussian Process Regression для предсказания того, сколько энергии узлы, вероятно, смогут собрать в ближайшем будущем, например при изменении освещённости. Она также задействует гибкую модель затухания и отражений радиосигналов в реалистичной городской среде. Эти компоненты поступают в процесс принятия решений, обновляемый каждые несколько секунд, что позволяет контроллеру быстро реагировать на изменения в сети. Сигнал вознаграждения, направляющий обучение, объединяет три простые идеи: эффективность (сколько бит информации передаётся на единицу энергии), справедливость (насколько равномерно распределена энергия между узлами) и приоритет (обеспечение ресурсов для задач с высокой срочностью). Настраивая относительную важность этих трёх компонентов, операторы сети могут выбирать между максимальным временем работы, строгой справедливостью или пиковыми скоростями передачи данных.

Что показывают симуляции

Поскольку реальные эксперименты ещё в процессе, авторы оценивают свой метод в подробных компьютерных симуляциях сети из 30 устройств с беспроводным питанием и также изучают сценарии до 100 узлов. По сравнению с простым фиксированным разделением энергии и более традиционным методом обучения новый контроллер поддерживает работу сети значительно дольше — примерно в полтора раза больше раундов до того, как узлы отключаются. Он также удерживает распределение уровней энергии между устройствами значительно плотнее, что означает гораздо меньше «мертвых зон», где узлы преждевременно выходят из строя. Обученная стратегия адаптируется в несколько раз быстрее к внезапным изменениям, таким как падение качества сигнала или резкий рост срочности задач, и обеспечивает более высокий пропуск данных при широком диапазоне радиоусловий. Важно, что авторы учитывают практические детали, показывая, что компактная версия обучающей модели может работать на недорогих микроконтроллерах, используемых во многих IoT-устройствах, с временем принятия решения порядка десятков миллисекунд.

От симуляций к реальным сетям сенсоров

В заключении исследование утверждает, что сочетание беспроводной передачи энергии с контроллером на основе обучения может существенно продлить срок службы и повысить надёжность сетей датчиков, особенно при непредсказуемых условиях и различающейся срочности задач. Признавая, что схемы сбора энергии насыщаются, что радиоокружение флуктуирует, и что в любой момент некоторые сенсоры важнее других, предложенный подход учится лучше балансировать конкурирующие потребности, чем статические правила. Авторы честно признают, что их результаты пока получены в симуляциях и что точные выигрыши потребуется подтвердить на реальном оборудовании. Тем не менее их работа указывает на будущее, в котором огромные сети мелких устройств смогут долго работать с минимальным вмешательством человека, интеллектуально «потягивая» энергию из воздуха и поддерживая поток важных данных.

Цитирование: Chen, H., Wang, X., Yuan, L. et al. DQN-empowered energy optimization for wireless powered communication networks. Sci Rep 16, 7987 (2026). https://doi.org/10.1038/s41598-026-38904-x

Ключевые слова: беспроводная энергия, Интернет вещей, сбор энергии, обучение с подкреплением, сети датчиков