Clear Sky Science · ru

Обнаружение аномалий в гиперспектральных изображениях на основе улучшенного алгоритма Isolation Forest

· Назад к списку

Видеть невидимое на спутниковых снимках

Современные спутники снимают не только красивые изображения Земли; они фиксируют сотни цветов света, которые наши глаза не видят. В этой радуге данных скрываются ранние признаки обвалов шахт, разливов нефти или военной маскировки. В обобщённой здесь статье предлагается новый способ автоматически обнаруживать крошечные необычные паттерны в этих гиперспектральных изображениях — что упрощает поиск небольших, но рискованных изменений на поверхности без необходимости привлекать армии человеческих аналитиков.

Figure 1
Figure 1.

Почему дополнительные спектральные каналы выявляют скрытые цели

Обычные спутниковые фотографии хранят три базовых цвета: красный, зелёный и синий. Гиперспектральные изображения, напротив, регистрируют десятки или даже сотни узких спектральных полос. Каждый пиксель несёт подробный «световой отпечаток», отражающий его состав — почву, породу, растительность, металл, воду или загрязнители. Проблема в том, что эти кубы данных огромны, шумны и перегружены избыточной информацией от атмосферы, датчиков и сложного рельефа. Обнаружение аномалий в такой среде означает выделение нескольких пикселей, резко отличающихся от окружения, без предварительной информации о том, что они представляют. Эти редкие пиксели могут сигнализировать об осадке грунта в шахтах, следах загрязнения или замаскированном оборудовании, поэтому их надёжное и быстрое выявление критично для мониторинга окружающей среды и безопасности.

От простых деревьев к более умным лесам

Исследование опирается на isolation forest — метод машинного обучения, предназначенный для поиска выбросов. В базовом варианте данные многократно случайным образом разбиваются, формируя набор решающих деревьев. Необычные точки обычно изолируются всего за несколько разбиений, тогда как нормальному фону требуется значительно больше. Эта идея хорошо работает на данных умеренного размера, но гиперспектральные сцены включают сотни каналов, значительный шум и очень тонкие аномалии. Случайный выбор признаков может тратить ресурсы на избыточные полосы, размывать контраст между целями и фоном и повышать число ложных срабатываний. Авторы поэтому переработали лес так, чтобы он получал более чистые данные и оценивал пиксели не только глобально по всему изображению, но и локально — в пределах их окрестностей.

Уточнение изображения с помощью многомасштабного зрения

Чтобы очистить и сжать данные перед обнаружением, метод сначала применяет низкоранговое и разреженное разложение, известное как Godec. Проще говоря, это разделяет изображение на гладкий слой фона и разреженный слой, содержащий резкие, необычные сигналы. Поверх этого авторы используют тот факт, что интересные цели часто выделяются не только спектрально, но и по пространственной структуре. Они применяют 3D-фильтры Габора, действующие как чувствительные к текстуре «линзы», проходящие через гиперспектральный куб и выделяющие паттерны разных размеров и направлений. Алгоритм суперпикселей на основе энтропийной скорости затем группирует соседние пиксели в небольшие согласованные области. Настраивая степень детализации этих регионов, метод подавляет случайный шум и одновременно сохраняет реальные структуры, такие как провалы, трещины или искусственные объекты.

Figure 2
Figure 2.

Комбинирование глобальных и локальных подсказок

После извлечения очищенных спектральных и пространственных признаков улучшенный isolation forest присваивает каждому пикселю оценку аномальности. Вместо того чтобы опираться только на то, насколько быстро пиксель изолируется в полном наборе данных, метод также проверяет его согласованность с ближайшим окружением. Пиксели, которые выглядят нормальными глобально, но странными в локальной окрестности, или наоборот, переоцениваются с помощью совместного правила оценки. Такой двухуровневый подход снижает как пропущенные детекции, так и ложные выбросы, вызванные сложным фоном. Тесты на двух широко используемых гиперспектральных наборах данных, San Diego и HYDICE, показывают, что новый подход достигает высоких показателей точности (AUC около 0.97 и F1 близко к 0.94), одновременно сохраняя низкий уровень ложных срабатываний и разумное использование памяти и скорости обработки.

От лабораторных испытаний к реальному мониторингу

Авторы дополнительно проверили метод на реальных задачах по отслеживанию проседаний в шахтах и экологического мониторинга с использованием спутниковых и авиационных данных. В районах шахт система корректно отмечает более 95% аномалий, связанных с обвалами, пропуская при этом лишь около 4%. В задачах экологического надзора она выявляет почти 94% подозрительных областей, таких как повреждённая растительность или возможная маскировка, опять же пропуская лишь несколько процентов. По сравнению с несколькими распространёнными методиками улучшенный лес демонстрирует как большую чувствительность, так и лучшую стабильность в разных сценариях. Для неспециалистов вывод прост: при аккуратной очистке данных, анализе паттернов на нескольких уровнях масштаба и сочетании глобальных и локальных суждений гиперспектральные изображения можно превратить в мощный автоматизированный инструмент «раннего предупреждения» о значимых изменениях на поверхности.

Цитирование: Li, A. Anomaly detection of hyperspectral images based on improved isolation forest algorithm. Sci Rep 16, 6171 (2026). https://doi.org/10.1038/s41598-026-36548-5

Ключевые слова: гиперспектральная съемка, обнаружение аномалий, дистанционное зондирование, isolation forest, мониторинг окружающей среды