Clear Sky Science · ru

Эффективная по данным базовая модель для пористых материалов на основе контролируемого обучения с участием экспертов

· Назад к списку

Обучая компьютеры «читать» губки для газов

Пористые материалы похожи на микроскопические губки, которые могут впитывать, сортировать и хранить газы — такие как углекислый газ, метан и водород. Они важны для более чистого топлива, улавливания углерода и химического производства. Но чтобы выяснить, какой новый материал будет работать лучше, обычно требуется огромное количество кропотливых симуляций и экспериментов. В этой статье представлена SpbNet — новый тип модели искусственного интеллекта, которая учит «язык» этих губчатых материалов гораздо эффективнее, используя встроенные физические знания вместо простого накопления данных.

Figure 1
Figure 1.

Почему умные губки так важны

Металло‑органические каркасы, ковалентные органические каркасы, пористые полимеры и цеолиты — все они относятся к семейству материалов, изобилующих крошечными, регулярно расположенными порами. Их эффективность зависит от формы этих пор и от того, как молекулы газа «ощущают» окружающее пространство при движении через них. В принципе компьютеры могут предсказывать такое поведение, но традиционные модели машинного обучения требуют огромных наборов данных для обучения, которые в материаловедении дорогие или вовсе недоступны: измеренные структуры и высококачественные симуляции ограничены. SpbNet решает это узкое место, встраивая хорошо изученные физические законы прямо в процесс обучения, что позволяет ей делать больше при гораздо меньшем объёме данных.

Основываясь на физике притяжения и отталкивания

Вместо того чтобы кормить модель только сырыми атомными координатами, авторы кодируют то, как усреднённая молекула газа взаимодействовала бы с материалом в множестве точек пространства. Они создают 20 «базовых» закономерностей, описывающих привычные силы: короткодистантное отталкивание при слишком близком сближении атомов и более дальнодействующее притяжение между ними. Эти шаблоны комбинируют в трёхмерную сетку, охватывающую поры материала и фиксирующую энергетический ландшафт, не привязанный к какому‑то конкретному виду газа. Одна часть SpbNet, основанная на графовой сети, изучает атомы и связи материала, тогда как другая, похожая на обработку изображений, анализирует эту энергетическую сетку. Модуль перекрёстного внимания позволяет этим двум потокам обмениваться информацией, чтобы модель могла соотнести локальные модели сил с глобальными формами пор.

Изучение геометрии в разных масштабах

Чтобы подготовить SpbNet к множеству задач, команда не начинает с просьбы напрямую предсказывать поглощение газа. Вместо этого сначала модель обучают решать геометрические задачи, которые учёные уже умеют вычислять: насколько широки самые узкие каналы, каковы размеры крупнейших полостей и какой объём и площадь поверхности действительно доступны для зондов разных размеров. На более тонком уровне модель учится определять, сколько атомов находится в каждой небольшой области и как далеко эта область от твёрдой поверхности. Эти контролируемые упражнения заставляют сеть развить детальную внутреннюю карту формы и связности пор, которая впоследствии оказывается полезной для широкого спектра свойств, связанных с хранением газов, их разделением и даже механической прочностью.

Figure 2
Figure 2.

Превосходя более крупные модели при меньшем объёме данных

После этой подготовки SpbNet дообучают для практических задач, таких как прогнозирование того, сколько углекислого газа или метана материал адсорбирует, насколько хорошо он разделяет газовые смеси и как газы диффундируют через него. По более чем 50 бенчмаркам SpbNet последовательно даёт более точные предсказания по сравнению с прежними передовыми моделями, включая те, которые обучались на почти в двадцать раз большем числе материалов. Она также удивительно хорошо обобщается: хотя предобучение проводилось только на одном классе пористых кристаллов (металло‑органических каркасах), модель эффективно переносится на родственнные, но отличающиеся материалы — такие как ковалентные органические каркасы, пористые полимерные сети и цеолиты — во многих случаях с существенным снижением ошибок.

Заглядывая в рассуждения модели

Чтобы понять, почему эта стратегия работает, авторы исследуют внутреннюю работу SpbNet. Они обнаруживают, что сочетание глобальных геометрических целей и локальных задач, связанных с поверхностью, побуждает модель сохранять богатую, локализованную информацию по мере прохождения сигналов через её многочисленные слои, вместо того чтобы сглаживать всё в безликое среднее. Удаление частей этого управляемого физикой обучения или отказ от энергетических дескрипторов заметно ухудшает предсказания, особенно для задач, зависящих от тонких эффектов размера и формы, таких как различение газов, которые отличаются лишь незначительно по размеру.

Что это означает для будущих открытий материалов

Проще говоря, SpbNet показывает, что можно обучить мощную и гибкую модель для пористых материалов без потопления её в данные, если аккуратно закодировать то, что уже известно из физики. Обучая сеть сначала понимать геометрию пор и общие шаблоны взаимодействий, авторы создают основу, которая обеспечивает точные и экономные в данных предсказания для многих конкретных задач. Такой подход может ускорить открытие лучших материалов для улавливания парниковых газов, очистки химических веществ и хранения чистого топлива, а также служить шаблоном для проектирования аналогично эффективных моделей в других областях науки с дефицитом данных.

Цитирование: Zou, J., Lv, Z., Tan, W. et al. A data-efficient foundation model for porous materials based on expert-guided supervised learning. Nat Commun 17, 2618 (2026). https://doi.org/10.1038/s41467-026-69245-y

Ключевые слова: пористые материалы, металло-органические каркасы, машинное обучение, адсорбция газов, базовые модели