Clear Sky Science · zh

用于三维模型参数化设计的强化学习驱动动态优化策略

2026-01-12 · 返回目录

更聪明的 3D 设计，减少试错

从引人注目的建筑到手机内部的微小机械零件，许多现代物体都始于三维计算机模型。设计师常使用“参数化”模型，通过滑块和公式来控制形状、尺寸和结构模式。这使得探索多种方案变得容易——但同时也创造出一个不可能靠手工穷尽的可能性迷宫。本文提出了一种新的人工智能方法，称为 HRL‑DOS，可帮助计算机在该迷宫中导航，自动改进三维设计以提升强度、材料利用率和制造便利性。

选择过多带来的挑战

在参数化设计中，一个对象可能依赖数十甚至数百个相互关联的参数：壁厚、孔径、曲线和对齐规则。随着模型变得越复杂，这些参数会以非显见的方式相互作用。传统优化工具要么依赖平滑的数学函数，在设计非规则或噪声较大时失效，要么依赖试错式搜索方法，在大规模问题上会异常缓慢。即使是标准的强化学习——让智能体通过反复试验和反馈学习——当必须同时考虑所有可能的设计决策组合时也会遇到困难。

像设计师一样思考的两层 AI

作者提出了基于分层强化学习的动态优化策略（Hierarchical Reinforcement Learning‑based Dynamic Optimization Strategy，简称 HRL‑DOS）来应对这种复杂性。HRL‑DOS 不把设计视为一个巨大的决策，而是将任务拆分为两层。高层策略选择整体方向——例如偏向更轻的重量、更高的对称性或更大的安全裕度。低层策略则在这一宏观方案内调整具体参数，如特定尺寸或特征位置。两层都根据当前模型在三个核心目标上的表现获得反馈：结构稳定性、几何效率和可制造性。这种分层结构反映了人类设计师的工作方式：先确定概念，再微调细节。

将原始三维模型转为可学习的数据

为训练该系统，研究人员以 ABC 数据集为起点——这是一个包含托架、齿轮、杠杆和安装板等详细工业三维模型的大型开放集合。他们对每个模型进行预处理，使 AI 能看到干净且一致的表示：几何体被归一化到标准尺度和方向；关键尺寸和特征被提取为参数；制造规则——例如最小壁厚或允许的悬垂角度——被编码为约束。这些参数随后被转换为紧凑的“潜在”描述，以自然抑制不可能或不稳定的形状。结果是一个数值化的状态，AI 可以在尊重基本工程规则的前提下安全地修改。

学习改进真实零件

在这个准备好的环境中，分层智能体反复提出新设计、运行仿真以估算重量和应力、检查可制造性，并获取组合奖励分数。经过大量训练回合后，高层智能体学会了哪些战略目标更有回报，而低层智能体则发现哪些参数调整确实能实现这些目标。团队在数据集中若干具有代表性的零件上测试了 HRL‑DOS——一块带肋托架、一个齿轮盘、一个杠杆手柄和一个安装板——并将其性能与若干先进替代方法进行比较，包括平层强化学习、基因算法混合方法以及其它 AI 辅助设计工具。HRL‑DOS 在达到良好解的速度上大约快了 27%，生成的模型总体质量评分约高出 18%。

既坚固又可制造且具有灵活性的设计

除了原始性能外，HRL‑DOS 在遵守严格工程限制方面也更为出色。它生成的违反安全或制造约束的设计要少得多，并在悬垂角度、内部空腔和公差等检查项上取得更高的可制造性评分。该方法对新出现的、未见过的零件类型也具有良好的泛化能力，并且在输入数据存在噪声或部分缺失时仍然稳健——这是现实设计工作流中一项重要特性。综上，这些结果表明分层强化学习可以作为智能计算机辅助设计的实用引擎，帮助建筑师和工程师在更短时间内探索更多方案，同时保持模型的安全性、效率和可制造性。

引用: Zhong, G., Vijay, V.C. Reinforcement learning-driven dynamic optimization strategy for parametric design of 3D models. Sci Rep 16, 5041 (2026). https://doi.org/10.1038/s41598-026-35863-1

关键词: 参数化 3D 设计, 强化学习, 设计优化, 计算机辅助设计, 生成式工程