Clear Sky Science · ru

Оптимизация пакетов экспериментов с учётом стоимости на основе глубоких гауссовских процессов для сложных кампаний по проектированию материалов

· Назад к списку

Более умный поиск — лучшие материалы

Проектирование новых металлов и сплавов похоже на поиск нескольких ценных игл в гигантской стоге сена. Каждую кандидатную рецептуру дорого проверять в лаборатории или на суперкомпьютере, поэтому учёные нуждаются в способах решить, какие из вариантов стоит испытать дальше. В этой работе предложена стратегия, которая рассматривает поиск материалов как осторожную игру вопросов: она решает не только, какой сплав исследовать следующим, но и какой тип испытания провести и какая будет его стоимость. Цель — быстрее находить высокоэффективные материалы при меньшем числе и меньших затратах на измерения.

Почему поиск такой сложный

Современные сплавы, особенно сплавы с высокой энтропией, где смешано много элементов в почти равных долях, занимают огромные пространства дизайна. Каждая композиция может иметь множество важных свойств — прочность, температуру плавления, теплопроводность и т. п. — которые часто противоречат друг другу. Измерить или смоделировать все свойства для каждой возможной рецептуры невозможно. Традиционные методы байесовской оптимизации помогают, обучая статистическую «заместительную» модель, которая предсказывает свойства по ограниченному числу примеров и предлагает следующие эксперименты. Но стандартные заместители испытывают трудности, когда зависимости сильно запутаны, когда свойства тесно связаны между собой или когда для образца измерены только некоторые свойства.

Многоуровневые модели, которые выявляют скрытую структуру

Для преодоления этих ограничений авторы опираются на глубокие гауссовские процессы — вид многоуровневой вероятностной модели. Вместо одной гладкой функции они стекают несколько слоёв, которые последовательно преобразуют входные данные. Ранние слои обучаются скрытым представлениям композиции сплава; более поздние слои сопоставляют эти скрытые признаки с несколькими свойствами одновременно. Такая иерархия естественно улавливает эффекты, например, изменение чувствительности к составу в разных областях пространства дизайна и сложные взаимосвязи между свойствами. Важное свойство модели — оценка собственной неопределённости, что критично при решении, стоит ли платить за ещё одно измерение. Поскольку разные свойства могут наблюдаться для разных сплавов, модель остаётся полезной при частичных, «заплаточных» данных и умеет переносить информацию между задачами.

Figure 1
Figure 1.

Каждое измерение должно иметь значение

Второй компонент — учёт стоимости. Не все измерения одинаковы: некоторые, например подробные тесты теплопроводности или температуры ликвидуса, дорогие; другие, такие как плотность или твёрдость, дешевле. Авторы расширяют популярное правило принятия решений, которое обычно оценивает лишь научную выгоду — насколько партия новых экспериментов может улучшить наилучшие известные компромиссы между свойствами. Их версия делит эту выгоду на общую стоимость предлагаемых экспериментов. Это стимулирует оптимизатор отдавать предпочтение множеству дешёвых информативных запросов и резервировать дорогие измерения для наиболее перспективных кандидатов. Они также комбинируют «изотопные» пакеты, где все свойства измеряются вместе, с «гетотопными» шагами, которые выборочно измеряют лишь более дешёвые свойства, используя эти результаты для уточнения модели перед дорогими тестами.

Тестирование на искусственных задачах и реальных сплавах

Команда сначала протестировала несколько вариаций подхода на стандартных многозадачных тестовых задачах с разными формами и уровнями сложности. Они сравнили простые одноцелевые модели, многоцелевые модели, которые разделяют информацию между свойствами, чисто глубокие модели и гибриды, сочетающие глубокие предсказания среднего с многоцелевыми оценками неопределённости. Результаты показали, что ни один метод не выигрывает во всём. Простые мелкопрогнозные модели превосходят на низкоразмерных, слабо изогнутых ландшафтах. Многоцелевые модели выигрывают в высокоразмерных пространствах, где цели сильно связаны. Глубокие и гибридные модели проявляют силу на сильно скрученных, невыпуклых ландшафтах, где важно уловить сложную структуру и скошенные распределения.

Более быстрый путь к высокоэффективным сплавам

Чтобы показать практическую пользу, авторы провели полностью смоделированную кампанию по поиску тугоплавких сплавов с высокой энтропией, предназначенных для работы при высоких температурах. Они исследовали пространство композиций из семи элементов и стремились одновременно максимизировать пять ключевых свойств, рассматривая два дополнительных свойства как полезную побочную информацию. Стоимости были назначены реалистично — теплопроводность и температура начала плавления оказались значительно дороже плотности, твёрдости или индикатора пластичности. Новая схема смогла направлять отбор в области композиционного пространства, которые балансировали множество целей по производительности, при активном повторном использовании дешёвых измерений и экономном привлечении дорогих. Глубокие стратегии с учётом стоимости сопоставимы или слегка превосходят традиционные методы, особенно по мере накопления данных, при этом более эффективно расходуя фиксированный бюджет на испытания.

Figure 2
Figure 2.

Что это значит для открытия материалов

Для неспециалиста главный вывод в том, что работа предлагает принципиальный способ разумнее «тратить» экспериментальные и вычислительные ресурсы при поиске новых материалов. Объединяя многоуровневые вероятностные модели, которые выявляют скрытые закономерности, с бюджетной стратегией, сопоставляющей ожидаемую научную выгоду и стоимость теста, подход позволяет достигать высокопроизводительных дизайнов сплавов за меньшее число лучше подобранных шагов. Хотя преимущества наиболее заметны в сложных, шумных задачах, этот фреймворк закладывает важную основу для будущих кампаний, где учёным придётся одновременно управлять множеством переменных, целей и жёсткими ресурсными ограничениями.

Цитирование: Alvi, S.M.A.A., Vela, B., Attari, V. et al. Deep Gaussian process-based cost-aware batch Bayesian optimization for complex materials design campaigns. npj Comput Mater 12, 105 (2026). https://doi.org/10.1038/s41524-026-01981-7

Ключевые слова: открытие материалов, байесовская оптимизация, глубокие гауссовские процессы, сплавы с высокой энтропией, проектирование с учётом стоимости