Clear Sky Science · ru
Модель обнаружения целей на туманной водной поверхности на основе совместной оптимизации
Почему важны более четкие виды на воде
Корабли, паромы и небольшие беспилотные лодки всё чаще полагаются на камеры и искусственный интеллект для обнаружения других судов и препятствий. Но в тумане или дымке камеры фиксируют блеклую, размывшуюся картину, особенно на открытой воде, где волны, блики и расстояние и так затрудняют видимость объектов. В этом исследовании рассматривается более умный подход к очистке туманных изображений и более надёжному обнаружению крошечных лодок с целью повышения безопасности навигации при плохой видимости.
Туман, маленькие лодки и сложная задача компьютерного зрения
В ясный день современные системы обнаружения объектов обычно хорошо находят автомобили, людей и лодки на изображении. Однако в туманных сценах контраст падает, края размываются, цвета блекнут, и маленькие цели почти сливаются с фоном. Стандартные детекторы глубокого обучения, эффективные на чётких изображениях, часто пропускают эти слабые контуры, особенно когда дроны или береговые камеры наблюдают большие пространства, а каждая лодка занимает всего несколько пикселей. Существующие подходы либо дообучают модели обнаружения на туманных изображениях, либо ставят отдельный шаг удаления тумана перед детекцией, либо объединяют несколько задач в единой сети. Каждый из подходов помогает, но ни один полностью не решает совокупные проблемы прозрачности атмосферы и крошечных целей на воде.

Совместная система, которая учится видеть сквозь туман
Авторы предлагают совместную систему под названием DTDJO, которая решает задачу с двух сторон одновременно. Во-первых, специализированная сеть удаления тумана обрабатывает сырое туманное изображение и пытается восстановить более чёткую структуру и контраст, при этом уделяя внимание сохранению мелких деталей, которые могут принадлежать малым лодкам. Во-вторых, улучшенная сеть обнаружения анализирует очищенное изображение, чтобы найти и классифицировать цели. Вместо раздельного обучения этих двух частей, систему оптимизируют сквозной (end-to-end) тренировкой, где обучение удалению тумана направляется конечной целью — корректным обнаружением объектов. Такое совместное обучение побуждает этап удаления тумана выделять признаки, наиболее важные для детекции, а не просто выдавать наиболее «красивое» изображение.
Внимание к крошечным деталям
Чтобы сделать часть удаления тумана более эффективной, исследователи переработали механизм внимания сети к признакам изображения. Они вводят многомасштабный модуль, который рассматривает шаблоны разного размера и одновременно отслеживает, где в изображении лежат важные структуры. Это помогает системе восстанавливать резкие грани и тонкую текстуру, относящуюся к маленьким удалённым целям. Также они уточняют способ объединения информации из ранних и глубоких слоёв, чтобы мелкие пиксельные детали и более высокоуровневые представления поддерживали друг друга вместо конкуренции. Чтобы сохранить практичность метода, тяжёлые математические блоки заменяют более лёгкими, требующими меньше вычислений, что ускоряет обработку без потери качества.

Помощь детектору в фокусировке на малых лодках
Улучшение очищенного изображения — лишь половина истории. Часть обнаружения в DTDJO основана на современном одноэтапном детекторе, но авторы добавляют смешанный модуль внимания, который усиливает полезные сигналы и подавляет шумный фон. Этот модуль сочетает информацию о том, какие каналы изображения наиболее информативны, с данными о том, где в пространстве расположены наиболее релевантные регионы. В туманных водных сценах это означает акцент на едва заметных очертаниях лодок и снижение влияния волн, отражений и неба. Команда также формирует новые обучающие наборы, беря популярные бенчмарки по детекции и добавляя реалистичный туман с использованием физической модели рассеяния, что позволяет тестировать систему как на общих сценах, так и на специфичных для воды изображениях.
Замеренные улучшения в реальных туманных сценах
При тестировании на новых наборах данных с туманными съёмками с дронов и смешанными водными сценами DTDJO последовательно превосходит как стандартные детекторы, так и другие методы, учитывающие туман. Он обнаруживает больше мелких и удалённых объектов, пропускает меньше лодок и лучше разделяет перекрывающиеся цели, частично скрывающие друг друга. По сравнению с сильным базовым детектором совместная система повышает среднюю точность обнаружения на несколько процентных пунктов в обоих наборах данных, что представляет существенный выигрыш в таких сложных условиях. При этом её архитектура удерживает вычислительные затраты значительно ниже, чем у некоторых тяжёлых моделей для мультитаскинга, что делает её более пригодной для работы в реальном времени.
Более ясные пути для безопасной навигации
Проще говоря, работа показывает, что совместное обучение шага очистки изображения и детектора объектов может помочь камерам надёжнее замечать малые лодки в тумане. Обучаясь тому, какие части туманного изображения действительно важны для поиска целей, система очищает лишь столько, сколько нужно, и направляет детектор на правильные детали. Хотя исследование сосредоточено на поверхности воды и камерах с дронов или береговых установок, та же идея может поддержать более безопасную навигацию и наблюдение во многих условиях с низкой видимостью — от прибрежных гаваней до рек и портов.
Цитирование: Zhang, H., Wang, H. Foggy water surface target detection model based on joint optimization. Sci Rep 16, 15693 (2026). https://doi.org/10.1038/s41598-026-44144-w
Ключевые слова: обнаружение объектов в тумане, изображение поверхности воды, удаление тумана с изображений, обнаружение малых лодок, морское компьютерное зрение