Clear Sky Science · ru

Стратегия динамической оптимизации на основе обучения с подкреплением для параметрического проектирования 3D‑моделей

· Назад к списку

Умнее 3D‑проекты — с меньшим числом догадок

От эффектных зданий до крошечных механических деталей внутри телефона — многие современные объекты рождаются как 3D‑компьютерные модели. Дизайнеры часто используют «параметрические» модели, в которых ползунки и формулы управляют формой, размерами и узорами. Это облегчает исследование множества вариантов, но одновременно создаёт лабиринт возможностей, который невозможно исследовать вручную. В статье предложен новый подход на базе искусственного интеллекта под названием HRL‑DOS, помогающий компьютерам ориентироваться в этом лабиринте и автоматически улучшать 3D‑модели по прочности, расходу материала и удобству производства.

Figure 1
Figure 1.

Проблема из‑за множества вариантов

В параметрическом проектировании один объект может зависеть от десятков или сотен связанных параметров: толщины стенок, размеров отверстий, кривых и правил выравнивания. По мере усложнения моделей эти параметры взаимодействуют друг с другом неочевидными способами. Традиционные инструменты оптимизации либо опираются на гладкие математические функции, которые дают сбои при нерегулярных или шумных конструкциях, либо используют методы проб и ошибок, которые при больших задачах оказываются чрезвычайно медленными. Даже стандартное обучение с подкреплением — когда агент ИИ учится через повторные пробы и обратную связь — испытывает трудности, если нужно одновременно учитывать все возможные комбинации проектных решений.

Двухуровневый ИИ, который думает как дизайнер

Авторы предлагают стратегию динамической оптимизации на основе иерархического обучения с подкреплением, HRL‑DOS, чтобы справиться с этой сложностью. Вместо того чтобы рассматривать проектирование как одно огромное решение, HRL‑DOS делит задачу на два уровня. Политика высокого уровня выбирает общее направление для проекта — например, отдавать приоритет меньшему весу, большей симметрии или дополнительному запасу прочности. Политика низкого уровня затем настраивает отдельные параметры, такие как конкретные размеры или расположение особенностей, в рамках этой общей стратегии. Обе политики получают обратную связь на основании того, насколько текущая модель соответствует трём основным целям: структурной устойчивости, геометрической эффективности и производственности. Такая иерархическая структура отражает подход человеческих дизайнеров: сначала выбирается концепция, затем доводятся детали.

Преобразование сырых 3D‑моделей в обучаемые данные

Для обучения системы исследователи используют набор данных ABC, большую открытую коллекцию детализированных промышленных 3D‑моделей — кронштейнов, шестерёнок, рычагов и монтажных пластин. Они предварительно обрабатывают каждую модель, чтобы ИИ получил чистое и согласованное представление: геометрия нормализуется к стандартному масштабу и ориентации; ключевые размеры и признаки извлекаются в виде параметров; правила производства — такие как минимальная толщина стенки или допустимые углы нависания — кодируются в виде ограничений. Эти параметры затем преобразуются в компактное «латентное» описание, которое естественным образом отталкивает невозможные или нестабильные формы. В результате получается числовое состояние, которое ИИ может безопасно изменять, не нарушая базовых инженерных правил.

Обучение улучшать реалистичные детали

В подготовленной среде иерархические агенты многократно предлагают новые проекты, запускают симуляции для оценки веса и напряжений, проверяют производственность и получают объединённый показатель награды. За многие эпизоды обучения агент высокого уровня изучает, какие стратегические цели приносят плоды, а агент низкого уровня обнаруживает, какие изменения параметров действительно достигают этих целей. Команда протестировала HRL‑DOS на нескольких типичных деталях из набора — рёберный кронштейн, зубчатый диск, рукоять‑рычаг и монтажную пластину — и сравнила его с несколькими продвинутыми альтернативами, включая плоское обучение с подкреплением, гибриды с генетическими алгоритмами и другие инструменты с поддержкой ИИ. HRL‑DOS находил хорошие решения примерно на 27% быстрее и выдавал модели с примерно на 18% более высоким общим качественным показателем.

Figure 2
Figure 2.

Проекты, которые прочны, пригодны для изготовления и гибки

Помимо чистой производительности, HRL‑DOS показал лучшее соблюдение строгих инженерных ограничений. Метод генерировал гораздо меньше проектов, нарушающих требования по безопасности или производству, и получал более высокие оценки по производственности при проверках таких показателей, как углы нависания, внутренние полости и допуски. Метод также хорошо обобщался на новые, ранее не встречавшиеся типы деталей и оставался устойчивым при шумных или частично отсутствующих входных данных — важное качество для реальных рабочих процессов проектирования. В совокупности эти результаты свидетельствуют о том, что иерархическое обучение с подкреплением может стать практичным механизмом для интеллектуального компьютерного проектирования, помогая архитекторам и инженерам исследовать больше вариантов за меньшее время, при этом сохраняя модели безопасными, эффективными и готовыми к изготовлению.

Цитирование: Zhong, G., Vijay, V.C. Reinforcement learning-driven dynamic optimization strategy for parametric design of 3D models. Sci Rep 16, 5041 (2026). https://doi.org/10.1038/s41598-026-35863-1

Ключевые слова: параметрическое 3D‑проектирование, обучение с подкреплением, оптимизация проектирования, проектирование с помощью компьютера, генеративная инженерия