Clear Sky Science · zh

使用双延迟深度确定性策略梯度强化学习技术优化宽带超材料吸收器

2026-04-18 · 返回目录

驯服波动的教学材料

现代无线链路、卫星电视和雷达都依赖于以极其精确的方式塑造看不见的波。工程师现在设计“超材料”——由微小图案构成的表面——可以吸收不需要的信号或扭转其极化以实现更清晰的通信和更好的隐身能力。本文展示了一种人工智能方法——强化学习——如何自动发现这些复杂结构的高性能设计，于数小时内完成原本可能需要数周专家试验与错误的工作。

为什么塑造波很重要

超材料是由重复微观图案构成的工程表面，能够以异常的方式与电磁波相互作用。通过调节这些图案的形状和间距，研究人员可以创建超薄吸收体，几乎吸收所有入射辐射，或开发能够翻转波的极化的转换器——例如将水平极化信号转换为垂直极化。这类器件对于降低雷达特征、减少信道间干扰以及在卫星和无线系统使用的拥挤频段中承载更多信息都至关重要。

让算法来做设计

传统上，工程师使用手动参数扫描或诸如遗传算法之类的启发式搜索方法来调整超材料设计。这些方法在参数众多时往往缓慢、计算资源消耗大且对初始猜测敏感。作者转而采用一种名为双延迟深度确定性策略梯度（TD3）的强化学习方法。在该框架中，一个人工“代理”提出一组超材料单元的几何尺寸，物理仿真器评估该设计在目标频带上吸收或转换波的性能，并将一个奖励分数反馈给代理。通过反复的提出与评分循环，代理逐步学习哪些图案效果最佳，而无需显式公式或预训练的替代模型。

打造更好的波海绵

第一个测试对象是由L形铜迹线位于金属背衬之上、以常见电路板材料隔开的超薄微波吸收体。目标是在Ku和K波段（卫星链路和雷达所用）尽可能宽的频率范围内实现超过90%的强吸收。TD3代理控制图案的四个关键几何特征，并直接与商业电磁仿真器交互。值得注意的是，仅在23次迭代内，算法便收敛到一个在12.2到22.4吉赫之间吸收超过90%入射波的设计，其带宽比使用相同基本布局的先前手动调优或算法优化版本更宽。在光学频率下对另一种全介质光吸收体的额外测试表明，相同的学习框架也能提升那里的性能，同时拓宽有效带宽并提高平均吸收率。

将极化翻转过来

随后，作者用一个更复杂的任务挑战该方法：设计一个能在宽频带上反射入射波并同时翻转其极化的表面。他们从单层图案出发，该图案将L形铜迹与位于相同薄基底和金属背衬之上的中央三角形结合。TD3代理再次调整几何细节。大约在81次迭代后，它找到了一个配置，能在11.8到24.2吉赫之间将超过90%的反射功率转换为正交极化——覆盖了整个Ku波段和大部分K波段。仿真还显示，这种高转换在入射角度高达50度时仍能保持，这是实际天线和隐身涂层所期望的特性。

从仿真走向实验台

为验证这些由AI发现的设计是否可行，团队使用标准光刻在40×40的单元阵列上制作了该极化转换表面。用喇叭天线和矢量网络分析仪的测量结果证实了几乎与仿真预测相同频带内的强交叉极化反射，只有因制造公差和有限样品尺寸带来的适度差异。与其他报道的器件相比，这种单层结构在保持紧凑且无需附加电路元件的同时，实现了可比或更好的带宽和效率。

这对未来的意义

通过展示TD3强化学习代理能够快速锁定高性能且可制造的超材料设计，这项工作指向了一种控制光与无线电波器件工程的新途径。研究人员无需手工费力地探索设计空间，只需定义目标——例如宽带吸收或鲁棒的极化转换——并让学习算法去搜索广阔的可能性景观。该方法具有足够的通用性，可扩展到吸收器和偏振器之外的许多光子学与微波组件，可能加速从低剖面天线到光学传感器和能量收集表面的创新。

引用: Mahmoud, B.E., Ali, T.A., Obayya, S.S.A. et al. Optimization of broadband metamaterial absorber using twin delayed deep deterministic policy gradient reinforcement learning technique. Sci Rep 16, 12745 (2026). https://doi.org/10.1038/s41598-026-41716-8

关键词: 超材料吸收器, 极化转换器, 强化学习设计, 宽带微波器件, 光子学优化