Clear Sky Science · ru

Модель обнаружения целей на туманной водной поверхности на основе совместной оптимизации

· Назад к списку

Почему важны более четкие виды на воде

Корабли, паромы и небольшие беспилотные лодки всё чаще полагаются на камеры и искусственный интеллект для обнаружения других судов и препятствий. Но в тумане или дымке камеры фиксируют блеклую, размывшуюся картину, особенно на открытой воде, где волны, блики и расстояние и так затрудняют видимость объектов. В этом исследовании рассматривается более умный подход к очистке туманных изображений и более надёжному обнаружению крошечных лодок с целью повышения безопасности навигации при плохой видимости.

Туман, маленькие лодки и сложная задача компьютерного зрения

В ясный день современные системы обнаружения объектов обычно хорошо находят автомобили, людей и лодки на изображении. Однако в туманных сценах контраст падает, края размываются, цвета блекнут, и маленькие цели почти сливаются с фоном. Стандартные детекторы глубокого обучения, эффективные на чётких изображениях, часто пропускают эти слабые контуры, особенно когда дроны или береговые камеры наблюдают большие пространства, а каждая лодка занимает всего несколько пикселей. Существующие подходы либо дообучают модели обнаружения на туманных изображениях, либо ставят отдельный шаг удаления тумана перед детекцией, либо объединяют несколько задач в единой сети. Каждый из подходов помогает, но ни один полностью не решает совокупные проблемы прозрачности атмосферы и крошечных целей на воде.

Figure 1. Система ИИ преобразует туманные изображения воды в более четкие виды, чтобы малые лодки и препятствия были заметнее.
Figure 1. Система ИИ преобразует туманные изображения воды в более четкие виды, чтобы малые лодки и препятствия были заметнее.

Совместная система, которая учится видеть сквозь туман

Авторы предлагают совместную систему под названием DTDJO, которая решает задачу с двух сторон одновременно. Во-первых, специализированная сеть удаления тумана обрабатывает сырое туманное изображение и пытается восстановить более чёткую структуру и контраст, при этом уделяя внимание сохранению мелких деталей, которые могут принадлежать малым лодкам. Во-вторых, улучшенная сеть обнаружения анализирует очищенное изображение, чтобы найти и классифицировать цели. Вместо раздельного обучения этих двух частей, систему оптимизируют сквозной (end-to-end) тренировкой, где обучение удалению тумана направляется конечной целью — корректным обнаружением объектов. Такое совместное обучение побуждает этап удаления тумана выделять признаки, наиболее важные для детекции, а не просто выдавать наиболее «красивое» изображение.

Внимание к крошечным деталям

Чтобы сделать часть удаления тумана более эффективной, исследователи переработали механизм внимания сети к признакам изображения. Они вводят многомасштабный модуль, который рассматривает шаблоны разного размера и одновременно отслеживает, где в изображении лежат важные структуры. Это помогает системе восстанавливать резкие грани и тонкую текстуру, относящуюся к маленьким удалённым целям. Также они уточняют способ объединения информации из ранних и глубоких слоёв, чтобы мелкие пиксельные детали и более высокоуровневые представления поддерживали друг друга вместо конкуренции. Чтобы сохранить практичность метода, тяжёлые математические блоки заменяют более лёгкими, требующими меньше вычислений, что ускоряет обработку без потери качества.

Figure 2. Пошаговый процесс, который уточняет изображение крошечных лодок в размытых водных сценах, чтобы детектор мог их обнаружить.
Figure 2. Пошаговый процесс, который уточняет изображение крошечных лодок в размытых водных сценах, чтобы детектор мог их обнаружить.

Помощь детектору в фокусировке на малых лодках

Улучшение очищенного изображения — лишь половина истории. Часть обнаружения в DTDJO основана на современном одноэтапном детекторе, но авторы добавляют смешанный модуль внимания, который усиливает полезные сигналы и подавляет шумный фон. Этот модуль сочетает информацию о том, какие каналы изображения наиболее информативны, с данными о том, где в пространстве расположены наиболее релевантные регионы. В туманных водных сценах это означает акцент на едва заметных очертаниях лодок и снижение влияния волн, отражений и неба. Команда также формирует новые обучающие наборы, беря популярные бенчмарки по детекции и добавляя реалистичный туман с использованием физической модели рассеяния, что позволяет тестировать систему как на общих сценах, так и на специфичных для воды изображениях.

Замеренные улучшения в реальных туманных сценах

При тестировании на новых наборах данных с туманными съёмками с дронов и смешанными водными сценами DTDJO последовательно превосходит как стандартные детекторы, так и другие методы, учитывающие туман. Он обнаруживает больше мелких и удалённых объектов, пропускает меньше лодок и лучше разделяет перекрывающиеся цели, частично скрывающие друг друга. По сравнению с сильным базовым детектором совместная система повышает среднюю точность обнаружения на несколько процентных пунктов в обоих наборах данных, что представляет существенный выигрыш в таких сложных условиях. При этом её архитектура удерживает вычислительные затраты значительно ниже, чем у некоторых тяжёлых моделей для мультитаскинга, что делает её более пригодной для работы в реальном времени.

Более ясные пути для безопасной навигации

Проще говоря, работа показывает, что совместное обучение шага очистки изображения и детектора объектов может помочь камерам надёжнее замечать малые лодки в тумане. Обучаясь тому, какие части туманного изображения действительно важны для поиска целей, система очищает лишь столько, сколько нужно, и направляет детектор на правильные детали. Хотя исследование сосредоточено на поверхности воды и камерах с дронов или береговых установок, та же идея может поддержать более безопасную навигацию и наблюдение во многих условиях с низкой видимостью — от прибрежных гаваней до рек и портов.

Цитирование: Zhang, H., Wang, H. Foggy water surface target detection model based on joint optimization. Sci Rep 16, 15693 (2026). https://doi.org/10.1038/s41598-026-44144-w

Ключевые слова: обнаружение объектов в тумане, изображение поверхности воды, удаление тумана с изображений, обнаружение малых лодок, морское компьютерное зрение