Clear Sky Science · zh

用于自适应网络攻击模拟和自动化事件响应的人工智能驱动多代理框架在网络靶场环境中的应用

2026-04-07 · 返回目录

为何更智能的网络演练至关重要

企业和政府每天都在使用“网络靶场”进行数字灾难演练——这些靶场是安全的沙盒网络，供攻击者和防御者练习。但许多训练场仍依赖脚本化、可预测的攻击场景，与当今隐蔽且多变的威胁相去甚远。本文提出了一种使这些演练更逼真的新方法：使用能够自我学习攻击与防御的人工智能“代理”，迫使人类学员和工具去应对会思考并能适应的对手。

从静态场景到动态战争游戏

传统网络靶场有点像预先排演的剧本：教员选择攻击脚本，按下开始键，然后观察过程。这对初学者有用，但在面对通过许多隐蔽步骤串联起来、探测防御并在被发现时改变策略的现代对手时则失效。文中引用的研究显示，超过一半的模拟攻击未包含诸如从一台被攻陷机器横向移动到另一台或躲避监控工具等关键战术。结果是看似完备的训练在纸面上不错，但无法让分析员为互联网上的复杂现实做好充分准备。

教会数字代理进攻与防守

为弥补这一差距，作者构建了一个多代理系统——一小群在共享虚拟网络中独立行动且相互交互的软件实体。一方面是攻击者代理，它们通过奖惩反馈学习规划和调整动作，类似游戏型人工智能学会取胜。另一方面是防御者代理，它们监视网络流量中的异常模式并自动选择响应措施，例如隔离可疑主机或阻断风险连接。两类代理都在大规模、真实的网络活动数据上训练，使其行为反映真实的恶意与正常使用情况，而非示例化的小样本。

构建并连接测试平台

团队将这些代理集成到 CyDER 2.0 中，这是一种基于云的网络靶场，能够部署不同类型的企业风格网络，从几十台机器的小型环境到拥有数百主机的大型环境。在训练之前，他们对底层数据进行了仔细清洗与重平衡，以免罕见攻击被日常流量淹没。攻击者代理使用深度学习探索多步骤序列，例如扫描弱主机、利用漏洞、升级权限，然后传播或窃取数据，同时尽量保持不被发现。防御者代理则结合两种互补方法：一种基于标记攻击调优的传统分类器，另一种是学习“正常”行为并标记偏差（包括此前未见技巧）的自动编码器。

智能靶场的实际表现

研究人员将其人工智能驱动的代理与两种常见替代方案对抗：固定脚本和行为始终不变的基于规则的多代理设置。在小型、中型和大型测试网络中，学习型代理以更高的准确率和更少的漏报检测到攻击。在最大规模网络的最严苛混合攻击场景中，新系统在捕获威胁与避免误报之间保持了良好平衡，而静态方法表现急剧下降。同样重要的是，其自动化响应比基线系统快了数秒，这在快速发展中的入侵中能显著限制损害。攻击者代理在训练过程中也变得更具能力，能串联出更长、更复杂的攻击链，同时所有代理的资源使用保持在适度范围内。

对现实准备度的意义

从外行人的视角看，该研究表明可以将网络安全演练从事先准备好的练习升级为双方自主思考的动态战争游戏。通过将会学习的攻击者和防御者接入逼真的练习网络并喂入真实流量记录，该框架生成的场景在外观和感受上更接近真实事件。在测试中，这带来了更灵敏的检测、更快速的反应，并能在不让系统不堪重负的情况下扩展到更复杂的环境。作者认为，这类智能靶场能更好地为安全团队应对未来攻击做准备，并为更自主的数字防御奠定基础，后续工作将侧重于瘦身这些强大代理，以便它们也能在更小、更弱的设备上运行。

引用: Agrawal, A., Nadeem, M., Al Nuaim, A. et al. Artificial intelligence driven multi agent framework for adaptive cyber attack simulation and automated incident response in cyber range environments. Sci Rep 16, 11673 (2026). https://doi.org/10.1038/s41598-026-45937-9

关键词: 网络靶场, 自适应网络攻击, 多代理系统, 人工智能驱动的防御, 事件响应