Clear Sky Science · zh

基于软行为者评论家算法的智能反射面辅助认知无线电系统性能优化

2026-05-05 · 返回目录

为拥挤的无线世界打造更聪明的空域

我们的手机、传感器和智能家居都在争夺同一项无形资源：无线电波。随着更多设备接入，从有限频谱中挤出额外性能变得至关重要。本文探讨了一种新方法，通过将能弯曲电波的“智能墙”与一种教网络如何自我配置的人工智能学习方法结合，来在不损害高优先级用户的前提下提升低优先级用户的数据速率。

共享而不干扰邻居

现代无线系统常采用“主用户—次用户”模型。主用户（例如有许可的服务）对某些频段拥有优先使用权。次用户仅在把干扰控制在严格限制以内时，才被允许重用相同信道。这就是认知无线电的核心思想：能够感知环境并自适应的无线电，使频谱被更高效地利用。挑战在于在对主用户几乎不可见的情况下，为次用户提供良好的数据速率。传统方法主要依赖基站端的巧妙信号处理，但随着网络密度和天线数量增加，这类方法会迅速变得复杂。

用智能反射面弯折信号

作者在方案中加入了一个强有力的新工具：智能反射面。这些是由许多微小无源单元组成的薄面板，能够调节它们对入射电波的反射方式，类似于一面可控的无线信号“镜墙”。通过精心选择反射模式，反射面可以将能量引导到目标次用户并远离主用户接收端，从而在不增加发射功率的情况下提升性能。论文分析了这样一个系统：一个拥有多天线的基站为次用户服务，若干反射面在现实的毫米波传播条件下帮助塑造信号在环境中的传播路径。

教网络学会自我调优

找到基站波束模式、发射功率和数百万个微小反射设置的最佳组合是一个混乱的数学难题。经典优化方法，如块坐标下降，通过在变量组之间交替求解来处理该问题。这些方法有效，但当反射面变大或环境发生变化时会变得缓慢且难以管理。作者将该任务转化为使用软行为者评论家（SAC）算法的深度强化学习智能体的学习问题。在此设置中，智能体观测当前信道状况、过去的反射相位和发射功率，然后提出新的反射设置。它获得的奖励主要基于次用户实现的数据速率，前提是对主用户的干扰保持在允许阈值以内。通过大量模拟交互，智能体学会了将观测直接映射到近似最优配置的策略。

仿真与硬件中的结果

通过大量仿真，基于SAC的控制器在多方面与传统块坐标下降基准进行了比较：次用户可达速率、反射单元和面板数量的影响、发射功率限制以及干扰约束。学习到的策略在数据速率上始终能够与基准匹配或超越，尤其是在智能反射面拥有大量单元时，同时在训练完成后所需的迭代计算大大减少。研究还评估了运行时：对于小型反射面，经典方法可能略快，但随着系统规模增长，基于学习的方法具有更好伸缩性。为支持实际部署，作者设计、制造并测试了一个16单元的基站天线阵列，工作频段为3到7 GHz。测量结果显示良好的匹配、天线间低相关性和约90%的辐射效率，证明该硬件平台能够支持高要求的多天线操作。

对未来无线网络的意义

通俗地说，这项工作展示了将智能反射面与学习算法结合，如何让低优先级设备在不打扰高优先级服务的前提下更积极地共享频谱。网络不再依赖人工设计的公式，而是学会在复杂环境和大量可控单元下自主瞄准和塑造信号。随着无线系统向5G之后演进，类似方法有望带来更高的数据速率、更好的覆盖和更高效的频谱利用，同时保持对干扰的可控性。

引用: Ghallab, R., Abdrabo, A. & Elashry, I. Soft actor critic-based performance optimization for IRS-aided cognitive radio systems. Sci Rep 16, 14283 (2026). https://doi.org/10.1038/s41598-026-49465-4

关键词: 认知无线电, 智能反射面, 深度强化学习, 无线频谱共享, 软行为者评论家