Clear Sky Science · zh

一种将增强现实与强化学习相结合的用于水下无人自主潜航器的通信新框架

2026-01-26 · 返回目录

深海之下的更智能机器人

在海床上，自主水下航行器为气候研究、基础设施检查和搜救行动充当我们的眼睛和耳朵。然而，这些机器人潜艇在一个信号缓慢、噪声大且能量稀缺的恶劣环境中，面临一个基本问题：如何清晰地通信与决策。本文提出了一种新方法，通过将增强和虚拟现实与强化学习（一种人工智能分支）相结合，帮助水下机器人更好地通信、识别目标并保持安全。

为什么水下通信如此困难

在水下发送数据远比在空气中困难得多。为 Wi‑Fi 和 5G 提供动力的无线电波会被海水迅速吸收。声学（基于声音）的信号虽然传播更远，但数据速率非常低，且可能出现延迟、回声或失真。磁感应仅在几十米的范围内有效。现有的水下机器人控制系统通常将这些通道分开处理并采用固定规则进行导航和感知。这导致在条件变化时适应缓慢、浪费电池能量，并使通信链路容易被窃听或攻击。

用于训练更佳直觉的虚拟海洋
Figure 1.

作者构建了一个增强和虚拟现实测试平台，重现了一个繁忙的水下世界：游动的鱼群、岩石、船只和浮标，以及真实的噪声和水中信号衰减。一个模拟的水下航行器在该环境中巡航，配备多种传感器——声纳、摄像头、声学调制解调器、能量计和位置追踪器。在虚拟场景中，研究人员可以滑动控制项来改变物体位置、水体条件和传感器设置，并立即观察机器人如何响应。该 AR/VR 层不仅仅是视觉效果；它将原始传感器数据融合为统一的 3D 图景，更便于 AI 系统理解并采取行动。

教机器人从经验中学习

该框架的核心是一种作者称之为自适应增强现实与强化学习调度策略（Adaptive Augmented Reality and Reinforcement Learning Scheduling Strategy，AARLSS）的 AI 策略。机器人不再遵循固定脚本，而是在虚拟海洋中通过试错学习。每时每刻，它观察融合后的传感器状态，选择一个动作（例如改变航向、调整传感器采样率，或在短程与长程通信之间切换），并获得一个奖励。该奖励平衡了四个目标：节能、减少延迟、降低安全风险以及减少计算与网络资源的使用。一个深度 Q 学习网络存储并更新不同决策的期望值，利用保存在回放记忆中的过去经验小批量样本，让机器人能从近期和较早的情形中学习。

从智能调度到更安全的任务
Figure 2.

AARLSS 还充当实时调度器。它决定哪些任务——导航、目标检测、通信或安全检查——应该在何时何地运行，以及数据应在机器人本地处理、卸载到边缘服务器，还是延后处理。在此之上，内置的入侵检测系统持续扫描传感器与网络数据的模式，以标记可能表明攻击或故障的异常，并可以触发保护措施，例如阻断风险链路或强制本地计算。在 AR/VR 仿真器中的测试表明，该框架优于多种已有的强化学习方法。它将水下航行器的能耗减少了约 20%，将通信和任务延迟降低了约 18–20%，并在复杂机动和杂乱场景中将目标检测准确率提升到大约 97–98%。

这对现实海洋意味着什么

对非专业读者来说，关键信息是这项研究指向更独立、高效且更值得信赖的水下机器人。通过在丰富的虚拟海洋中训练并学会同时权衡能量、时间、精度与安全，AARLSS 使航行器能够选择何时发声、何时聆听、何时沉默以节省能量——同时保持对周围环境的敏锐监控并保护其数据。尽管这些结果来自复杂的模拟器而非开阔海域，但它们表明未来的水下机器人舰队有望在更少人为监督的情况下执行更长时间、更安全且数据更丰富的任务，提升从海洋科学到海上工业检查的各类工作。

引用: Lakhan, A., Mohammed, M.A., Ghani, M.K.A. et al. A novel augmented reality and reinforcement learning empowered communication framework for underwater unmanned autonomous vehicle. Sci Rep 16, 6241 (2026). https://doi.org/10.1038/s41598-026-36647-3

关键词: 水下机器人学, 自主水下航行器, 强化学习, 增强现实, 水下通信