Clear Sky Science · ru

Использование признаков, учитывающих дымку, для повышения четкости изображений и точности обнаружения с оптимизированной сетью DCNN-YOLOv8

2026-03-19 · Назад к списку

Почему важна хорошая видимость в тумане

Едете ли вы утром в туман или просматриваете задымленную запись с охранной камеры, мы интуитивно понимаем, насколько опасны скрытые автомобили или пешеходы. Многие современные системы — автопилоты, дорожное наблюдение и даже картография со спутников — зависят от того, что компьютеры «видят» ясно. Однако дымка и туман сбивают с толку современные алгоритмы зрения, из‑за чего они пропускают важные объекты. В этой статье предлагается новый подход, который обучает компьютер не только очищать задымленные изображения, но и оценивать качество этой очистки, а затем более надежно обнаруживать объекты в сложных погодных условиях.

Проглядывая сквозь мглу

Уличные снимки, сделанные в условиях дымки, теряют яркость, контраст и четкость краев, потому что мелкие частицы в воздухе рассеивают и поглощают свет. В результате удаленные автомобили сливаются с фоном, а дорожные знаки становится трудно различить. Предложено множество методов «удаления дымки», но реальная эффективность часто нестабильна: одни методы восстанавливают контраст, но искажают цвета; другие резче передают детали, но остаются ненадежными при изменении погоды или места съемки. Существенным пробелом является надежный способ для самой системы оценивать визуальное качество восстановленных изображений, особенно когда недоступен идеально чистый эталон.

Обучая машину понимать, как выглядит хорошее изображение

Авторы решают эту задачу, создавая конвейер, который начинается с извлечения признаков, учитывающих дымку, адаптированных под туманные сцены. Для каждого входного изображения система вычисляет новый тип дескриптора, названный Haze aware Structural Pixel Neighbor (HSPN), который суммирует, как каждый пиксель соотносится с соседями по яркости и текстуре. Эти признаки комбинируются с показателями средней яркости, локальной вариативности и цветового баланса, а также со статистиками, отражающими, как дымка меняет естественное распределение интенсивностей изображения. В совокупности эти признаки дают системе компактное, но содержательное описание того, насколько сильно дымка нарушает структуру и цвет сцены.

Более умный механизм обучения под капотом

Полученные признаки, учитывающие дымку, поступают в глубинную сверточную нейронную сеть (DCNN), которая предсказывает объективный «оценочный балл» качества для каждого изображения. Для эффективной тренировки сети авторы вводят новую стратегию оптимизации под названием Chronological Chimp Optimization Algorithm (CChOA). Вдохновленная групповым охотничьим поведением шимпанзе и дополненная временным механизмом, CChOA направляет процесс обучения через прошлые и текущие кандидатные решения, помогая сети не застревать в плохих локальных оптимумах. На практике это означает, что сеть предсказания качества сходится быстрее, достигает меньшей ошибки на обучении и ведет себя стабильнее по сравнению со стандартными оптимизаторами или исходным методом, основанным на моделях шимпанзе.

От улучшенных изображений — к лучшему обнаружению

После того как система улучшает и оценивает качество изображений, улучшенные кадры передаются в модифицированную версию YOLOv8, быструю сеть для обнаружения объектов. Авторы адаптируют YOLOv8 специально для туманных условий, уточняя функцию потерь для более точного локализации мелких и перекрывающихся объектов, добавляя модуль в стиле Inception для захвата деталей на нескольких масштабах и вставляя блок пространственного пирамидального объединения, который помогает сети учитывать и локальные детали, и более широкий контекст. Обученная и протестированная на двух эталонных наборах данных по дымке (RESIDE и FRIDA), интегрированная система обеспечивает более четкие изображения и более надежное обнаружение по сравнению с несколькими существующими методами удаления дымки и оценки качества, а также превосходит базовый YOLOv8 по точности обнаружения в тумане.

Что это значит для систем компьютерного зрения в реальном мире

Проще говоря, исследование показывает, что компьютеры могут значительно лучше обнаруживать объекты в тумане, если сначала научиться понимать, как выглядит хорошее качество изображения в таких условиях, и если процесс обучения оптимизирован. Объединив признаки, чувствительные к дымке, временно‑чувствительную стратегию оптимизации и настроенную сеть обнаружения, предложенная система заметно повышает ясность и показатели обнаружения по стандартным метрикам. Такой интегрированный подход может сделать будущие охранные камеры, системы помощи водителю и средства дистанционного зондирования безопаснее и надежнее в плохую погоду.

Цитирование: Saini, A., Gill, N.S. & Gulia, P. Leveraging haze-aware features for improved image clarity and detection accuracy with an optimized DCNN-YOLOv8 network. Sci Rep 16, 14213 (2026). https://doi.org/10.1038/s41598-026-38265-5

Ключевые слова: удаление дымки с изображений, обнаружение объектов, глубокое обучение, компьютерное зрение в тумане, YOLOv8