Clear Sky Science · ru
Набор данных и эталон изображений тонких шлиф карбонатных пород для глубокого обучения
Почему важно смотреть на крошечные породы
Нефтяные и газовые компании, климатологи и геологи одинаково заинтересованы в рассказах, запечатанных в породах. Разрезая породы на бумажно-тонкие пласты и рассматривая их под микроскопом, специалисты читают подсказки о древних морях, захороненных рифах и путях, по которым под землей перемещаются нефть, газ и вода. В этой статье представлен DeepCarbonate — крупная, тщательно проверенная коллекция изображений таких шлиф. Она разработана так, чтобы современные системы искусственного интеллекта могли автоматически распознавать типы пород, делая эту традиционную практику быстрее, более последовательной и легче распространяемой по миру.

От образца в руках до цифровой галереи пород
Проект стартует с реальных образцов, пробуренных и отобранных в крупных нефтеносных формациях Сычуаньского бассейна Китая и Объединённых Арабских Эмиратов. Геологи сначала осматривают каждую шлифу невооружённым глазом, чтобы убедиться, что изучаемая часть репрезентативна для всего образца. Чтобы не вводить себя в заблуждение локальными особенностями, они рассматривают по крайней мере восемь различных видов при двух увеличениях, проверяя текстуры и зерна, пока общий тип породы не будет определён с уверенностью. Только затем фиксируют настройки микроскопа и снимают высокоразрешённые изображения, сфокусированные на тонких деталях, важных для понимания того, как образовались эти породы и как через них движутся флюиды.
Фиксация пород при разном освещении
DeepCarbonate делает больше, чем просто одно фото каждой точки. Та же шлифа снимается несколькими способами: в обычном проходящем свете, в перекрёстных поляризаторах, в отражённом свете и иногда после окрашивания, которое заставляет одни минералы ярко проявляться цветом, а другие оставаться тусклыми. Каждый режим освещения подчёркивает разные признаки — форму кристаллов, поровые пространства или органические остатки, которые могут указывать на углеводороды. Вместе они дают более богатое представление, чем любое отдельное изображение. Все снимки выполняются при согласованном увеличении, выбранном как компромисс между детализацией и полем зрения, и проходят строгую проверку качества, при которой размытые, слишком тёмные или повреждённые кадры отбрасываются.
Привлечение панели человеческих экспертов
Поскольку тонкие особенности пород могут быть трудны для интерпретации, команда не полагается на единичное мнение. Десять специалистов по карбонатным породам независимо проверяют изображения и предлагаемые метки. Если слишком многие не согласны с первоначальным определением, такие изображения отбрасываются, чтобы не рисковать обучением вычислительных систем на сомнительных примерах. Оставшиеся кадры сортируются в 22 различных категории пород — от тонкозернистых илстонов и богатых ископаемыми известняков до трещиноватых образований, пористых «пенных» сетей и микробных структур, таких как Stromatolites и thrombolites. Такое широкое покрытие отражает многолетние классические системы классификации пород, но упаковано для эпохи геологии, основанной на данных.
Создание справедливой тестовой площадки для ИИ
После маркировки изображения реорганизуются в структуру, знакомую исследователям машинного обучения по известным наборам данных для компьютерного зрения. Коллекция — более 55 000 изображений в целом — разделена на обучающую, валидационную и тестовую подвыборки для каждого режима освещения. Авторы затем подвергают проверке набор популярных сетей распознавания изображений, от ResNet и VGG до MobileNet и EfficientNet, на этой новой площадке. Они измеряют не только то, как часто модель точно определяет тип породы, но и насколько хорошо правильный ответ ранжируется среди её лучших предположений, а также насколько справедливо модели работают с частыми и редкими классами пород.

Чему машины научились о породах
Результаты показывают, что DeepCarbonate представляет собой сложную, но обучаемую задачу: современные сети способны правильно классифицировать большинство изображений, при этом более лёгкие, эффективные модели часто показывают особенно хорошие результаты. Исследование также выявляет, как неравномерные размеры классов — факт того, что некоторые типы пород в наборе данных встречаются гораздо чаще других — могут смещать алгоритмы в сторону «частых» пород. Создав более сбалансированную подвыборку, использующую только девять наиболее представленных классов, авторы демонстрируют улучшение производительности: модели точнее фокусируются на действительно диагностических признаках изображений. Совместное использование всех режимов освещения также повышает результативность, подтверждая, что дополнительные визуальные подсказки имеют реальную ценность для машин, так же как и для человеческих петрографов.
Что это значит для энергетики и наук о Земле
Для неспециалиста DeepCarbonate по сути представляет собой совместную, высококачественную «книгу изображений» микроскопических пород в сочетании с чётким набором правил для проверки того, насколько хорошо компьютеры могут её «читать». Делая и изображения, и код открыто доступными, авторы предлагают общую мерку, чтобы будущие инструменты ИИ для анализа пород можно было сравнивать справедливо. В долгосрочной перспективе такой стандартизованный, экспертно проверенный набор данных может помочь превратить медленный, ручной ремесленный процесс в более быстрый, объективный цифровой подход — способствуя лучшим решениям в разведке углеводородов, хранении углерода и нашем более широком понимании того, как земные «архивы» пород запечатлевают историю планеты.
Цитирование: Li, K., Song, J., Zhang, Z. et al. A dataset and benchmark of carbonate thin-section images for deep learning. Sci Data 13, 340 (2026). https://doi.org/10.1038/s41597-026-06633-5
Ключевые слова: карбонатные породы, изображения тонких шлиф, глубокое обучение, петрография, геологические наборы данных