Clear Sky Science · zh

用于无人机群基于飞行自组织网络的安全与自适应通信的可解释多智能体强化学习框架

2026-03-03 · 返回目录

在棘手场景中更聪明的无人机团队

想象一支无人机队伍冲入野火、洪水区或搜救现场。它们必须即时共享信息，应对试图干扰或欺骗它们的攻击者，同时还能向人工操作员解释为何选择某条路径而非另一条。本文提出了一种新方法，使此类无人机群既更安全又更易理解，从而在生死关头赢得人们的信任。

为什么无人机群需要的不仅是快速的Wi‑Fi

群体中的无人机不仅在飞行；它们不断通信，转发地图、传感器读数和告警。这种空中网络称为飞行自组织网络，速度快且灵活，但也脆弱。信号在空中传播，无人机快速移动，且没有中央塔台负责管理。这使得网络容易成为数字攻击的目标，例如阻塞信号、伪造身份或悄然丢弃消息。现有的安全工具常依赖于缓慢的集中式服务器或不透明的“黑箱”算法，这在生命、财产或关键基础设施面临风险时尤其危险。

教会每架无人机学习与决策

作者提出了一个可解释的多智能体强化学习框架——EMARL‑XAI，将每架无人机变成一个学习智能体。与遵循固定规则不同，每架无人机观察自身位置、信号质量、电量以及邻机的可信程度。通过一种协作学习方法，蜂群逐步发现哪些通信路径能够可靠传递消息、规避可疑无人机并节省能量。“谁应当转发这个数据包？”等决策来自经验而非硬编码。关键在于不存在单一主节点：无人机以去中心化方式学习和行动，更适合快速变化且敌对的空域。

识别不良行为者并保持连通

安全性被直接编织进群体的学习过程。每架无人机维护对附近无人机的持续“信任估计”，基于它们是否转发消息、行为是否一致或是否出现攻击迹象，例如大量丢包或表现出多个假身份。该信任评分会影响后续选择：可靠的邻居被优先选为中继，而可疑的则逐步被绕过并有效孤立。该框架在详尽的仿真中针对一系列真实威胁进行测试——包括干扰、身份欺骗、Sybil攻击和黑洞攻击——仿真将网络仿真器（用于无线链路和干扰）与无人机飞行仿真器（用于二维和三维空间的运动）耦合。

让无人机的选择可被理解

除了原始性能外，系统还被设计为能解释自身决策。可解释性模块使用现代AI中的知名工具展示哪些因素对决策影响最大。例如，一种称为SHAP的方法将信任或信号强度等输入按其对所选路径的影响进行排序，而另一个方法LIME在特定决策周围构建简单的局部“假设性”模型。可视化注意力图突出近期行为中学习系统关注的模式。结合这些视图，人工操作员可以看到，例如某架无人机避开某个邻居主要是因为该邻居过去的转发行为可疑，而不是因为瞬时的信号衰减。这把一团神经网络计算转化为可追溯的叙述。

该新方法在虚拟空域中的表现如何

研究人员将EMARL‑XAI与经典路由方法及更传统的基于学习的系统进行对比。在最多75架无人机且其中高达30%表现为恶意的模拟任务中，该新框架提供了更高的成功分组传输率、减少了延迟，并将误判诚实无人机为恶意的比率保持在相对较低水平。与没有信任机制或可解释性模块的类似多智能体学习系统相比，它也能更快学到稳定策略，并在每次成功传输上消耗更少能量。当作者系统地去除设计中的某些部分时，性能下降明显：移置信任机制会显著增加关于谁是恶意者的错误判断，而移除可解释性工具则大体不影响准确率，但会让人类评估者的信心大幅下滑。

这对现实无人机任务意味着什么

对非专业读者而言，主要结论是这项工作使无人机群更接近成为值得信赖的队友，而非神秘且脆弱的设备。EMARL‑XAI展示了无人机如何在不断变化且敌对的环境中自主学习安全地路由消息，同时留下清晰、可人工阅读的决策轨迹。虽然该研究基于仿真，仍需在真实硬件上测试，但它为无人机队伍走向更聪明、更安全且更有问责性的方向勾画了路线——这是让它们参与灾害应对、城市监测或保护关键基础设施所必需的重要一步。

引用: Alkahtani, H.K., Galiya, Y., Akbayan, B. et al. Explainable multi agent reinforcement learning framework for secure and adaptive communication in UAV swarm based fanets. Sci Rep 16, 11830 (2026). https://doi.org/10.1038/s41598-026-39366-x

关键词: 无人机群, 安全通信, 多智能体强化学习, 可解释人工智能, 无线网络安全