Clear Sky Science · ru
Эталонный набор данных для машинного обучения суррогатов взаимодействия CO2 и воды на порах
Почему для подземного хранения углерода нужны более точные «картины»
Когда речь идет о борьбе с климатическими изменениями, одна из крупных идей — улавливать диоксид углерода (CO2) со «дымоходов» и хранить его глубоко под землей. Но подземные породы — это не гладкие резервуары: они ближе к сложной губке, полной крошечных изгибов и закоулков, где вода и CO2 соперничают за пространство. В этой работе представлен новый, детализированный цифровой «фильм» о том, как CO2 вытесняет воду через эти крошечные поры, дающий исследователям исходные данные для создания ускоренных компьютерных моделей, способных предсказывать, останется ли CO2 надежно захваченным в недрах.

Вглядываясь в пористую «губку» породы
Подземные резервуары, такие как песчаники или вулканические породы, пронизаны микроскопическими порами, заполненными водой. Когда в них закачивают CO2, газ вынужден пробираться через этот лабиринт: иногда он стремится по каналам, а иногда застревает в тупиках. Эти мелкомасштабные узоры определяют, сколько CO2 можно хранить и насколько надежно будет это хранение на десятилетия и столетия. Традиционные лабораторные эксперименты и визуализация дают лишь представление о поведении в нескольких небольших образцах, тогда как высокоточные численные симуляции отслеживают каждую деталь — но требуют много времени и вычислительных ресурсов. В результате инженеры часто опираются на упрощенные формулы, которые размывают сложную мелкомасштабную картину и могут упустить важные явления.
Почему «умным» суррогатам нужны богатые обучающие данные
Модели машинного обучения обещают короткий путь: однажды обученные, они могут предсказывать движение CO2 в породе значительно быстрее, чем полные физические симуляции. Но, как любой ученик, такие модели хороши ровно настолько, насколько хороши примеры, которые они видели. Многие существующие наборы данных слишком малы, охватывают лишь простые структуры пор или фиксируют только конечный результат впрыска, а не развитие процесса во времени. Это затрудняет обучение алгоритмов на изменяющиеся формы CO2-струй, накопление давления или то, как тонкие изменения в структуре пор влияют на течение. Без более содержательных обучающих материалов «умные» суррогаты рискуют делать уверенные, но ненадежные прогнозы при столкновении с новыми, более сложными породами.

Создание детализированного «фильма» CO2 и воды в сложных порах
Авторы восполняют этот пробел, собрав эталонный набор данных, фиксирующий взаимодействие CO2 и воды на очень мелкой шкале. Они начинают с создания множества синтетических «камней» в виде пиксельных карт, где твердые зерна и открытые поры расположены в разных узорах. Тщательно изменяя размер и расстояние между зернами, они получают пять уровней структурной сложности — от упорядоченных до сильно нерегулярных. Для каждой такой цифровой породы проводят продвинутые симуляции, в которых CO2 входит с одной стороны и вытесняет воду через поровое пространство. Каждая прогонка даёт 100 равномерно расположенных кадров во времени, записанных на сетке 512 × 512 пикселей с микрометровым разрешением, отслеживая расположение CO2 и воды, изменение давления и распределение скоростей течения по всему лабиринту.
Что содержит набор данных и как его можно использовать
В результирующей коллекции — 624 уникальные структуры пор, каждая из которых снабжена полной временной серией поведения флюидов. Для каждого образца набор данных содержит изображения скелета породы, долю каждого пикселя, заполненную водой, а также поля давления и скорости потока в горизонтальном и вертикальном направлениях. Дополнительные таблицы перечисляют объемные свойства, такие как пористость (сколько пустого пространства в породе) и проницаемость (насколько легко движутся флюиды), вместе с мерами, которые инженеры используют для описания сопротивления потоку. Всё хранится в стандартных научных форматах файлов, что облегчает подключение к собственным кодам исследователей. Такая структура позволяет моделям машинного обучения обучаться не только предсказывать конечные результаты, но и шагать во времени — прогнозируя, как эволюционирует CO2-облако от одного момента к другому.
Проверка, улучшает ли разнообразие обучение
Чтобы показать, почему эта разнородность важна, авторы обучают три версии популярной нейросети, работающей с изображениями, на разных частях набора данных. Одна версия видит все пять уровней сложности пор, другая — только четыре, а третья — один, самый простой уровень. Когда модели просят предсказать распределение CO2 в самых сложных породах, модель, обученная на самом разнообразном наборе, в среднем демонстрирует лучшие результаты, более точно воспроизводя форму симулируемых струй на протяжении многих временных шагов. Модели, которых кормили узкими примерами, допускают большие ошибки, особенно по мере продвижения предсказаний дальше во времени. В то же время авторы отмечают, что большее разнообразие не гарантирует улучшение в каждом отдельном случае, что указывает на необходимость баланса между богатством данных и их чрезмерной сложностью при проектировании обучающих выборок.
Что это значит для будущего подземного хранения углерода
Проще говоря, эта работа предоставляет высококачественное «поле для тренировок» для алгоритмов, которые однажды помогут проектировать и отслеживать проекты подземного хранения CO2. Предоставляя множество детализированных примеров того, как CO2 и вода пронизывают реалистичные поровые сети, набор данных помогает инструментам машинного обучения изучить правила игры, а не заучить несколько частных сценариев. Главное вывод: включение грязной вариативности реальных пород в обучающие данные приводит к лучшим средним прогнозам того, как закачанный CO2 будет двигаться и удерживаться. Это, в свою очередь, может поддержать более надежные и эффективные решения о том, где и как безопасно хранить углерод под нашими ногами.
Цитирование: Abdellatif, A., Menke, H.P., Maes, J. et al. A Benchmark Dataset for Machine Learning Surrogates of Pore-Scale CO2-Water Interaction. Sci Data 13, 621 (2026). https://doi.org/10.1038/s41597-025-05794-z
Ключевые слова: хранение углерода, пористые породы, машинное обучение, течение в масштабе пор, впрыск CO2