Clear Sky Science · ru

Гибридная сеть внимания локально-глобального уровня для классификации изображений тонких срезов горных пород

2026-01-28 · Назад к списку

Почему умные методы для изображений горных пород важны

Горные породы, скрытые глубоко под землей, содержат подсказки о том, где безопасно прокладывать туннели, где искать подземные воды или где бурить на нефть и газ. Геологи изучают эти породы, рассматривая тончайшие срезы под микроскопом, но ручная разметка тысяч изображений медленна и субъективна. В этом исследовании предложена новая система искусственного интеллекта, названная HFANet, которая обучается распознавать типы пород по изображениям тонких срезов с почти идеальной точностью, что может ускорить геологические съемки и сделать их более согласованными.

Видеть общую картину и мельчайшие детали

Большинство инструментов компьютерного зрения хорошо справляются либо с выявлением широких закономерностей, либо с фокусировкой на мелких деталях, но не с тем и другим одновременно. Тонкие срезы пород особенно сложны: песчаники, лавы и метаморфические породы при увеличении или уменьшении масштаба могут выглядеть обманчиво похоже. HFANet решает эту задачу, разделяя проблему на два взаимодополняющих взгляда. Одна ветвь сети смотрит на всё изображение целиком, чтобы уловить общую структуру и распределение минералов в поле зрения. Другая ветвь разбивает изображение на небольшие фрагменты и изучает текстуры, границы зерен и крошечные трещины в каждой части.

Объединяя эти перспективы, система имитирует то, как обученный геолог переводит взгляд с целого слайда на отдельные зерна.

Обучая сеть тому, куда стоит обращать внимание

Просто запускать две ветви параллельно недостаточно — им нужно обмениваться информацией. HFANet использует механизмы внимания — математические инструменты, которые подсказывают модели, какие части изображения наиболее важны для принятия решения. Сначала ветвь, ориентированная на фрагменты, учится, какие локальные области несут наиболее полезную информацию, позволяя фрагментам «обращать внимание» друг на друга. Затем этап межветвного взаимодействия позволяет глобальным и локальным признакам направлять друг друга в обоих направлениях. Глобальный взгляд подталкивает модель к геологически значимым областям, тогда как детальные фрагменты возвращают в глобальное сведение тонкие текстуры и границы. Такое взаимное внимание помогает системе выделять ключевые сигналы, например различия между двумя очень похожими песчаниками, которые в противном случае вызвали бы путаницу.

Сочетание человекоподобных признаков и глубокого обучения

В дополнение к тому, что сеть изучает самостоятельно, авторы включили традиционные дескрипторы изображений, которые долгое время использовали геологи и аналитики изображений. Сюда входят измерения цветового баланса, грубости текстуры и вариаций яркости, которые фиксируют, например, насколько зерна выделяются на фоне или насколько упорядочена текстура. HFANet рассматривает эти классические признаки как дополнительный источник данных, подавая их в глобальную ветвь и позволяя сети научиться взвешивать их значимость. Такое объединение добавляет лишь небольшие вычислительные затраты, но заметно улучшает точность, особенно в сложных магматических породах, где едва заметные изменения текстуры и состава минералов затрудняют классификацию.

Тестирование производительности и общности

Исследователи обучали и оценивали HFANet на большой учебной базе данных из Нандзинского университета, которая включает более 2600 микроскопических изображений, охватывающих 108 типов пород — осадочных, магматических и метаморфических. В задачах с тонкой градацией, например при различении подтипов осадочных пород, HFANet превысил 99% точности и показал идеальные результаты по рейтинг-метрикам, которые измеряют, насколько хорошо модель разделяет классы. По всем трём основным группам пород он стабильно превосходил широко применяемые CNN и Transformer-модели. Команда затем задала более трудный вопрос: как модель ведёт себя на другой коллекции минералогических тонких срезов, которых она никогда не видела при обучении? Там более простая сеть в целом показала немного более высокую сырую точность, но HFANet по-прежнему демонстрировал лучшую способность ранжировать правильный класс высоко, что говорит о том, что его внутреннее представление образцов пород остаётся сильным даже при изменении условий съёмки.

Заглядывая в рассуждения модели

Чтобы проверить, фокусируется ли HFANet на геологически значимых областях, авторы сравнили карты внимания модели с аннотациями экспертов. На примерах изображений вулканических осадочных пород HFANet выделял фрагменты вулканического стекла, кристаллический обломочный материал и трещины — структуры, которые эксперты используют для идентификации и интерпретации этих пород. Его фокус хорошо совпадал с нарисованными от руки масками важных признаков и был более точен по сравнению со стандартными методами визуализации, применёнными к ведущей базовой модели. Это согласование указывает на то, что система не просто запоминает цвета или шум, а ориентируется на границы, текстуры и взаимоотношения между зернами, имеющие научное значение.

Что это значит для будущей геологической работы

Для повседневной геонауки HFANet указывает путь к автоматизированным инструментам, которые могут быстро и надёжно маркировать изображения тонких срезов, отмечать неоднозначные случаи и помогать стандартизировать учебные коллекции. Хотя его двухветвевой дизайн с интенсивным вниманием требует больше вычислительных ресурсов, чем у простых сетей, он обеспечивает редкое сочетание точности, интерпретируемости и уважения к геологической структуре. При дальнейшем совершенствовании производительности и адаптации к новым микроскопам и наборам пород системы вроде HFANet могут стать надёжными помощниками для специалистов, беря на себя рутинную классификацию пород и освобождая геологов для сложной интерпретации и принятия решений.

Цитирование: Wei, P., Fan, C., Yang, X. et al. A hybrid local-global feature attention network for thin section rock image classification. Sci Rep 16, 6446 (2026). https://doi.org/10.1038/s41598-026-36669-x

Ключевые слова: изображения тонких срезов горных пород, классификация с помощью глубокого обучения, сети внимания, геологический анализ изображений, автоматизация петрохрафии