Clear Sky Science · ru

Интерпретируемое машинное обучение для проектирования термоэлектрических материалов с использованием сетей Колмогорова–Арнольда

· Назад к списку

Преобразование тепла в полезную энергию

Ежедневно огромные объёмы энергии теряются в виде тепловых отходов — от автомобильных двигателей и заводов до наших электронных устройств. Термоэлектрические материалы предлагают способ непосредственно превращать часть этого отходящего тепла в электричество без подвижных частей и без топлива. Однако найти новые материалы с высокой эффективностью сложно, поскольку их свойства зависят от нескольких тесно связанных электронных параметров. В этом исследовании рассматривается новый тип искусственного интеллекта, который не только предсказывает, насколько хорош материал, но и объясняет почему — открывая более ясный путь к проектированию лучших термоэлектрических соединений.

Figure 1
Figure 1.

Почему трудно найти лучшие материалы для преобразования тепла в энергию

Термоэлектрические устройства опираются на материалы, которые генерируют напряжение при наличии разницы температур между горячей и холодной сторонами. Их эффективность характеризуется величиной zT, которая зависит от трёх основных компонентов: насколько сильно носители заряда реагируют на температуру (коэффициент Зеебека), насколько легко они передвигаются (электропроводность) и насколько хорошо материал проводит тепло (теплопроводность). Улучшение одного параметра часто ухудшает другой — например, повышение электрической проводимости может одновременно увеличить теплопроводность, что снижает эффективность. Традиционные квантово-механические расчёты, такие как теория функционала плотности, могут предсказывать эти свойства по атомной структуре, но они настолько ресурсоёмки, что их нельзя применить к миллионам кандидатов.

Чёрные ящики и потребность в понимании

Модели машинного обучения в последние годы стали мощным инструментом для быстрого оценки свойств материалов на основе предыдущих расчётов и экспериментов. В этой работе авторы начинают с подробных численных описаний кристаллических структур, полученных специальным энкодером «Crystalformer», который фиксирует расположение атомов и их взаимодействия в кристалле. Сначала они обучают стандартный многослойный перцептрон — распространённую модель глубокого обучения — предсказывать две ключевые величины: коэффициент Зеебека и электронную запрещённую зону (band gap), которая влияет на способность материала обеспечивать подвижные носители заряда. Эта модель достигает высокой точности по обоим задачам на большой базе данных примерно из 15 000 соединений. Однако, как и большинство глубоких сетей, она ведёт себя как чёрный ящик, мало говорящий о том, какие структурные признаки действительно важны и как они в совокупности формируют термоэлектрический отклик.

Другой тип нейронной сети

Ключевая идея статьи — заменить непрозрачные нейронные сети сетями Колмогорова–Арнольда (KANs). Вместо того чтобы весь сложный функционал скрывать в активациях нейронов, KAN прикрепляют гибкие одномерные кривые к связям между слоями. Математически эти кривые представляют собой гладкие сплайны, адаптирующиеся к данным, и вся модель может быть записана как сумма простых функций от входных дескрипторов. После обучения авторы аппроксимируют полученные сплайны компактными математическими выражениями, составленными из знакомых функций — синусов, косинусов и гладких насыщающих кривых. Таким образом модель превращается в явную символьную формулу, связывающую структурные дескрипторы с запрещённой зоной и коэффициентом Зеебека, а не в путаницу непрозрачных параметров. Хотя обучение KAN требует больше вычислительных ресурсов, они достигают точности, сопоставимой с многослойным перцептроном, а в некоторых режимах и превосходящей его, а также превосходят несколько других методов машинного обучения из литературы.

Figure 2
Figure 2.

Что модель узнаёт о материалах

Изучая внутреннюю структуру KAN, авторы показывают, что на каждое свойство сильно влияет лишь подмножество из 128 структурных дескрипторов. Они вычисляют оценки атрибуции, чтобы выделить наиболее важные дескрипторы, а затем удаляют слабые связи, оставляя разреженную, легче интерпретируемую сеть, которая при этом сохраняет хорошую предсказательную способность. Используя пары наиболее значимых дескрипторов, они строят двухмерные карты, показывающие, как прогнозируемая запрещённая зона или коэффициент Зеебека меняются в пространстве дескрипторов. Эти карты выявляют плавные, кооперативные эффекты, где осцилляторные и насыщающие тенденции комбинируются, а не сводятся к простым однозначным правилам. С химической точки зрения модель хуже справляется со сложными системами с сильно направленной связью или с интенсивным взаимодействием d- и f-электронов, но даже в таких случаях KAN дают более стабильные и физически осмысленные предсказания по сравнению с чёрным ящиком. Например, они генерируют меньше нефизичных отрицательных значений запрещённой зоны и реже предсказывают знак коэффициента Зеебека неверно.

От предсказания к направленному проектированию

Поскольку KAN выдают явные гладкие формулы, а не только числовые предсказания, их можно использовать для исследования того, как изменение базовых дескрипторов повлияет на термоэлектрические характеристики. Хотя эти дескрипторы остаются абстрактными величинами, выведёнными глубоким энкодером структуры, они коррелируют с реальными особенностями расположения атомов и природы связей. Это означает, что исследователи могут использовать аналитическую модель KAN как некую карту: просматривая её в поисках областей, ассоциированных с высоким коэффициентом Зеебека и подходящей запрещённой зоной, они могут сузить круг перспективных материалов, а затем сопоставить выявленные паттерны дескрипторов с кандидатными кристаллическими структурами в больших базах данных или в инструментах генеративного проектирования.

Что это значит для будущих материалов

Для неспециалиста ключевая мысль в том, что эта работа приближает нас к «стеклянному ящику» искусственного интеллекта в области открытия материалов. Сети Колмогорова–Арнольда демонстрируют почти такую же эффективность, как лучшие чёрные предикторы, но при этом дают в явной математической форме объяснение того, как структурные особенности кристалла связаны с его способностью преобразовывать тепло в электричество. Такое сочетание скорости, точности и интерпретируемости может помочь учёным принимать обоснованные решения о том, какие новые соединения синтезировать и тестировать, потенциально сокращая путь от сырых данных до реальных термоэлектрических устройств, утилизирующих тепловые отходы и повышающих энергоэффективность.

Цитирование: Fronzi, M., Ford, M.J., Nayal, K.S. et al. Interpretable machine learning for thermoelectric materials design with Kolmogorov–Arnold networks. Sci Rep 16, 14146 (2026). https://doi.org/10.1038/s41598-026-44723-x

Ключевые слова: термоэлектрические материалы, интерпретируемое машинное обучение, сети Колмогорова–Арнольда, проектирование материалов, коэффициент Зеебека