Clear Sky Science · ru
Объяснимая многоагентная среда обучения с подкреплением для безопасной и адаптивной связи в роях БПЛА на базе FANET
Более умные команды дронов для сложных условий
Представьте себе команду дронов, спешащих к пожару, в зону наводнения или на операцию по поиску и спасению. Им нужно мгновенно обмениваться данными, уклоняться от атакующих, пытающихся заглушить или обмануть их, и при этом уметь объяснить людям‑операторам, почему был выбран тот или иной маршрут. В статье представлен новый подход, который делает такие роевые системы дронов одновременно безопаснее и понятнее, чтобы люди могли им доверять в критических, жизненно важных ситуациях.
Почему рою дронов нужно больше, чем просто быстрый Wi‑Fi
Дроны в рое не только летают — они постоянно передают данные: карты, показания датчиков и предупреждения друг другу. Такая воздушная сеть, называемая летающей ad hoc‑сетью (FANET), быстрая и гибкая, но при этом хрупкая. Сигналы передаются по открытому воздуху, дроны быстро перемещаются, и нет центральной вышки управления. Это делает сеть легкой мишенью для цифровых атак, таких как заглушение сигналов, подмена идентичностей или скрытое удаление сообщений. Существующие инструменты безопасности часто зависят от медленных централизованных серверов или непрозрачных «чёрных ящиков», что представляет риск, когда на кону — жизни, имущество или критическая инфраструктура.
Обучение каждого дрона принимать решения
Авторы предлагают объяснимую многоагентную архитектуру обучения с подкреплением — EMARL‑XAI — которая превращает каждый дрон в обучающегося агента. Вместо жёстких правил каждый аппарат наблюдает свою позицию, качество сигнала, уровень заряда батареи и степень доверия к соседям. С помощью кооперативного обучения рой постепенно обнаруживает, какие маршруты передачи сообщений надёжны, какие аппараты подозрительны и как экономить энергию. Решения вроде «кто должен переслать этот пакет дальше?» возникают из опыта, а не прописываются заранее. Важный момент — отсутствие единой управляющей ноды: дроны учатся и действуют децентрализованно, что лучше соответствует быстро меняющемуся и враждебному воздушному пространству. 
Выявление злоумышленников и поддержание связи
Безопасность встроена непосредственно в процесс обучения роя. Каждый дрон поддерживает текущую «оценку доверия» для соседей, основанную на том, пересылают ли они сообщения, ведут ли себя последовательно или проявляют признаки атаки — например массово отбрасывают пакеты или действуют как множество поддельных идентичностей. Эти оценки доверия влияют на будущие выборы: надёжные соседи предпочтительны в роли ретрансляторов, тогда как подозрительных аппаратов постепенно обходят и по сути изолируют. Архитектура тестируется против ряда реалистичных угроз — заглушения, подмены идентичности, атак Сайбила и «чёрных дыр» — в подробной симуляции, сочетающей сетевой симулятор (для радиосвязи и помех) и симулятор полёта дронов (для движения в 2D и 3D пространстве).
Делаем выборы дронов понятными
Помимо чистой эффективности, система разработана так, чтобы объяснять свои решения. Модуль объяснимости использует известные инструменты современной ИИ, чтобы показать, какие факторы сильнее всего повлияли на решение. Например, метод SHAP ранжирует входные данные, такие как доверие или мощность сигнала, по влиянию на выбранный маршрут, а другой метод, LIME, строит простые локальные «что‑если» модели вокруг конкретных решений. Визуальные карты внимания подчёркивают паттерны в недавнем поведении, на которых сосредоточилась система обучения. Совокупность этих представлений позволяет операторам видеть, например, что дрон избежал определённого соседа в основном потому, что его прошлое поведение при пересылке выглядело подозрительно, а не из‑за едва заметного падения уровня сигнала. Это превращает запутанные вычисления нейронных сетей в прослеживаемую историю.
Как новый подход показывает себя в виртуальном небе
Исследователи сравнивают EMARL‑XAI с классическими методами маршрутизации и более традиционными системами на основе обучения. В моделируемых миссиях с участием до 75 дронов и до 30% из них, ведущих себя вредоносно, новая архитектура обеспечивает большую долю доставленных пакетов, сокращает задержки и сохраняет относительно низкий уровень ошибочных обвинений честных дронов. Она также быстрее вырабатывает стабильные стратегии, чем аналогичная многоагентная система без компонента доверия или объяснимости, и расходует меньше энергии на успешную доставку по сравнению с традиционными схемами. При систематическом удалении частей конструкции производительность падает: исключение механизма доверия резко увеличивает ошибки в определении злоумышленников, тогда как исчезновение инструментов объяснимости мало влияет на точность, но заметно снижает уверенность человеческих оценщиков. 
Что это значит для реальных миссий дронов
Для неспециалиста главный вывод таков: эта работа приближает рои дронов к тому, чтобы стать надёжными напарниками, а не загадочными и хрупкими устройствами. EMARL‑XAI показывает, как дроны могут самостоятельно учиться безопасно маршрутизировать сообщения в меняющейся и враждебной среде, оставляя после себя ясный, читаемый человеком след действий и мотивов. Хотя исследование основано на симуляциях и требует проверки на реальном оборудовании, оно очерчивает путь к флотам дронов, которые будут не только умнее и безопаснее, но и подотчётнее — важный шаг, если мы рассчитываем на них при ликвидации катастроф, мониторинге городов или защите критической инфраструктуры.
Цитирование: Alkahtani, H.K., Galiya, Y., Akbayan, B. et al. Explainable multi agent reinforcement learning framework for secure and adaptive communication in UAV swarm based fanets. Sci Rep 16, 11830 (2026). https://doi.org/10.1038/s41598-026-39366-x
Ключевые слова: Рой БПЛА, безопасная связь, многоагентное обучение с подкреплением, объяснимая ИИ, безопасность беспроводных сетей