Clear Sky Science · ru

Генерация 3D-форм на уровне деталей, управляемая выводом пользовательских предпочтений с помощью предпочтительной байесовской оптимизации

· Назад к списку

Почему нужны более умные инструменты 3D-дизайна

Каждый, кто пытался что-то создать в 3D — будь то предмет мебели в приложении для домашнего дизайна или персонаж для игры — знает, как быстро варианты начинают перегружать. Современный ИИ может генерировать впечатляющие 3D-формы по простым подсказкам, но он редко понимает, что именно человеку нравится в дизайне. В этой статье представлен BOgen — новая система, которая помогает дизайнерам собирать стулья, комбинируя и смешивая детали, в то время как ИИ незаметно узнаёт их вкусы и направляет к более удачным вариантам.

От текстовых подсказок к осмысленным 3D-выборам

Недавние достижения генеративного ИИ умеют превращать текстовые описания вроде «деревянный обеденный стул с изогнутой спинкой» в детализированные 3D-модели. Тем не менее такие инструменты в основном гоняются за визуальным эффектом. Они мало помогают при тех неаккуратных, итеративных решениях, которые действительно принимает дизайнер, особенно когда нужно заменить конкретные детали — например, совместить ножки одного стула со спинкой другого. Авторы утверждают, что полезная система должна ставить намерения дизайнера выше внешней привлекательности и работать на уровне деталей, а не только с целым объектом. BOgen решает это, сочетая мощный генератор 3D-форм с интерфейсом, который позволяет пользователям выбирать, сравнивать и снова комбинировать части стула, пока система отслеживает их предпочтения.

Figure 1
Figure 1.

Преобразование сложной вселенной форм в простую карту

За каждым сгенерированным 3D-стулом скрывается высокоразмерный код, описывающий его общую структуру и детали. Прямой поиск по этому огромному пространству был бы слишком медленным для интерактивного инструмента. Чтобы решить эту проблему, авторы обучают вариационный автокодировщик (VAE), который сжимает структурную информацию о каждом стуле — особенно расположение деталей — всего до двух чисел. Эти два числа размещают каждый возможный стул на плоской «карте исследования». Близкие точки соответствуют стульям с похожими общими формами, тогда как удалённые — очень разным типам: от простых обеденных стульев до декоративных или необычных изделий. Эта карта позволяет дизайнерам блуждать по сложной вселенной дизайна так, как если бы они просматривали двумерный атлас возможностей для стульев.

Пусть ИИ выводит предпочтение по простым действиям

BOgen делает больше, чем просто показывает варианты; он учится на действиях пользователя. Когда дизайнер отмечает любимый стул, наводит курсор на примеры на карте или просит «ещё таких», система рассматривает этот выбор как подсказку о том, что важно — возможно, округлая спинка, тонкие ножки или компактный след. Техника, называемая предпочтительной байесовской оптимизацией, моделирует эти сигналы как относительные предпочтения, а не жёсткие оценки. Она оценивает, какие области карты исследования, вероятно, содержат дизайны, которые понравятся пользователю, а какие области остаются неопределёнными. Используя эту оценку, система выбирает новые точки на карте для пробных образцов, уравновешивая безопасные варианты, соответствующие текущему вкусу, и более рискованные предложения, которые могут выявить новые интересы.

Проектирование путём подмены и смешивания деталей

В интерфейсе BOgen пользователи могут выбрать «основной» стул и «вторичный» стул и напрямую синтезировать новый дизайн, интерполируя их детали — например, объединяя спинку одного стула с ножками другого. Подлежащий части-aware 3D-генератор восстанавливает полную 3D-модель из этих смешанных компонентов. Каждый новый дизайн снова размещается на карте исследования, чтобы дизайнеры могли видеть, где он находится относительно прочих вариантов. Со временем, по мере повторения цикла исследования и подмен деталей, система уточняет своё понимание того, какие комбинации перспективны, и предлагает более таргетированные варианты, фактически сотворяя вместе с дизайнером, а не просто реагируя на отдельные подсказки.

Figure 2
Figure 2.

Тестирование BOgen с реальными дизайнерами

Для оценки BOgen исследователи попросили 30 обученных или практикующих дизайнеров выполнить задачи по ранней проработке стульев, используя два инструмента: базовый интерфейс «UIonly» и полный набор BOgen. Оба могли генерировать и перекомбинировать стулья по текстовым подсказкам, но лишь BOgen включал карту исследования и рекомендации, руководимые предпочтениями. Количественные показатели показали, что BOgen стал увереннее в предпочтениях пользователей, надёжнее выявлял понравившиеся дизайны и побуждал пользователей исследовать более широкую и разнообразную область пространства дизайна. Ответы опросов и интервью подтвердили эти выводы: дизайнеры считали, что BOgen лучше проясняет их цели, выдвигает полезные предложения и позволяет делать открытия, которые они вряд ли сделали бы, опираясь только на текстовые подсказки.

Что это значит для повседневных инструментов дизайна

Проще говоря, исследование показывает: недостаточно, чтобы ИИ был талантливым 3D-скульптором; он должен также выступать вдумчивым ассистентом. BOgen демонстрирует, как сжатие сложных 3D-вариантов в простую карту и статистическое моделирование выборов пользователя могут превратить открытое генеративное создание в направленный поиск, подстраиваемый под вкус каждого человека. Хотя работа фокусируется на стульях и оптимизирует лишь визуальную привлекательность, та же схема — отображать пространство, наблюдать выборы пользователей и предлагать новые варианты соответственно — может быть адаптирована к различным типам 3D-ассетов, от транспортных средств до персонажей. По мере того как такие системы будут развиваться и начнут учитывать реальные ограничения, например прочность и технологичность производства, они могут сделать продвинутый 3D-дизайн более доступным, эффективным и творчески удовлетворяющим как для профессионалов, так и для непрофессионалов.

Цитирование: Lee, S.W., Choi, J. & Hyun, K.H. Part-level 3D shape generation driven by user intention inference with preferential Bayesian optimization. Sci Rep 16, 7715 (2026). https://doi.org/10.1038/s41598-026-38916-7

Ключевые слова: 3D-генеративный дизайн, байесовская оптимизация, исследование дизайна, ориентированный на пользователя ИИ, моделирование на основе деталей