Clear Sky Science · ru

Интеграция упрощённого Swin-T с модифицированным EFS-Net для сегментации подводных трубопроводов с управлением вниманием в сложных подводных условиях

· Назад к списку

Почему наблюдение за дном океана важно

Скрытые под волнами обширные сети труб переносят нефть, газ и силовые кабели, от которых зависят современные общества. Если эти подводные трубопроводы треснут, подвергнутся коррозии или сдвинутся, это может привести к дорогостоящим простоям и серьёзному загрязнению. Сегодня большая часть инспекций выполняется людьми, просматривающими часы мутного видео с подводных роботов. В этой статье представлена новая система искусственного интеллекта (ИИ), которая автоматически выделяет трубопроводы на сложных подводных изображениях, даже когда они тусклые, засыпаны «морским снегом» или частично зарыты в песок. Такой шаг к надёжной автоматизированной инспекции может сделать прибрежную энергетику и инфраструктуру безопаснее и дешевле в обслуживании.

Figure 1
Figure 1.

Видеть ясно в мутном мире

Подводные изображения известны своей сложностью для компьютерной интерпретации. Свет быстро затухает с глубиной, цвета смещаются в зелёные и синие тона, а взвешенные частицы создают дымку и точки, похожие на снег. Классические методы обработки изображений, опирающиеся на резкие границы и хороший контраст, обычно терпят неудачу, когда трубопровод покрыт песком, заслонён растительностью или размывается туманом. Глубокое обучение улучшило ситуацию, и несколько популярных нейросетей уже умеют обнаруживать трубы в отдельных наборах данных. Тем не менее такие системы часто специализируются на одном типе водных условий или конфигурации камеры. При встрече с новой средой — другой водой, освещением или фоном — их точность резко падает. Основная задача — создать модель, которая была бы одновременно точной и адаптивной, но при этом достаточно эффективной для работы в реальных системах инспекции.

Двухмозговой подход к подводным изображениям

Авторы решают эту задачу, создав гибридную архитектуру ИИ, которая сочетает два принципиально разных «способа видения». Одна ветвь, основанная на упрощённой версии Swin Transformer, выступает как обзорный наблюдатель с широким ракурсом. Она сканирует весь кадр, чтобы уловить крупномасштабные закономерности, например общий маршрут трубы по донному рельефу. Вторая ветвь, адаптированная из модели EFS-Net и использующая EfficientNet в качестве основы, действует как лупа. Она сосредоточена на тонких деталях — границах, текстурах и тонких структурах, которые показывают, где начинается труба и где песок или растительность. Обе ветви обрабатывают одни и те же масштабированные изображения и преобразуют их во внутренние карты признаков, описывающие, какие структуры сеть считает значимыми в каждой области снимка.

Пусть внимание решает, что важно

Простое объединение выходов этих двух ветвей породило бы путаницу из избыточной информации. Вместо этого модель использует механизм «внимания», чтобы решать для каждого пикселя, какие детали стоит учитывать. Модуль перекрёстного внимания с тремя головами сопоставляет признаки из ветви, ориентированной на детали, с признаками ветви, ориентированной на контекст. По сути, ветвь деталей задаёт целевые вопросы — «является ли эта граница частью трубопровода?» — в то время как ветвь контекста даёт глобальные подсказки — «имеет ли смысл линия в этой позиции и направлении как часть трубы?». Дополнительный этап уточнения, называемый CBAM, ещё больше усиливает сигнал от вероятных областей трубопровода и подавляет фоновые шумы, такие как камни, водоросли или взвешенные частицы. Декодер затем постепенно восстанавливает маску исходного размера, отмечая каждый пиксель как «трубопровод» или «не трубопровод».

Figure 2
Figure 2.

Испытание системы

Чтобы оценить, работает ли такая конструкция на практике, исследователи собрали большой и требовательный набор данных под названием HOMOMO. Он содержит более 120 000 цветных изображений реальных донных трубопроводов, снятых вдоль 1,2 километра трубы при разнообразных и часто враждебных условиях: слабое освещение, морской туман, плавающий «снег», песчаные наносы и густая растительность. Они обучали свою модель на части этой коллекции и затем сравнили её с широко используемыми системами, такими как UNet, DeepLab, SwinUNet, TransUNet, Mask2Former и несколькими версиями детектора объектов YOLO. На HOMOMO их гибридная модель корректно сегментировала пиксели трубопровода с показателем mean intersection-over-union около 98%, что существенно выше, чем у лучшего конкурента. Что не менее важно, при тестировании — без дообучения — на двух очень разных источниках изображений, синтетическом наборе Roboflow и реальных видео с YouTube, модель по-прежнему показала высокие результаты, продемонстрировав способность работать с новыми камерами и условиями воды.

Что это значит для реального океана

Для неспециалистов вывод заключается в том, что эта ИИ-система способна надёжно выделять контуры подводных трубопроводов в видеокадрах, которые слишком шумные и непоследовательные для традиционных методов. Сочетая глобальный обзор сцены с внимательным рассмотрением границ и текстур и используя внимание для объединения этих перспектив, модель достигает высокой точности без необходимости огромных вычислительных ресурсов. На практике такой инструмент мог бы помочь автономным роботам непрерывно контролировать длинные участки подводной инфраструктуры, отмечая возможные повреждения или погребение для последующей проверки человеком. Хотя модель по-прежнему испытывает сложности с чрезвычайно тонкими или полностью скрытыми трубами, подход представляет собой важный шаг к более безопасной и автоматизированной инспекции скрытой инфраструктуры, поддерживающей современные энергетические и коммуникационные сети.

Цитирование: Hosseini, N., Mohanna, F. & Moghimi, M.K. Integrating simplified Swin-T with modified EFS-Net for attention-guided underwater pipelines segmentation in complex underwater environments. Sci Rep 16, 6987 (2026). https://doi.org/10.1038/s41598-026-38081-x

Ключевые слова: подводные трубопроводы, сегментация изображений, глубокое обучение, морская инспекция, трансформерные сети