Clear Sky Science · ru

Оценка направления прихода акустического вектора под водой в условиях гибридного шума на основе механизма mixture-of-experts с разреженной активацией

· Назад к списку

Прислушивание к скрытым сигналам под водой

Корабли, подводные лодки, автономные подводные аппараты и даже морские биологи полагаются на улавливание слабых звуков в океане, чтобы определить, откуда они исходят. Но море — шумное место: двигатели, волны, животные и сами измерительные приборы создают помехи. В этом исследовании предлагается новый способ определения направления подводных звуков даже при хаотичном и непредсказуемом шуме, с помощью современной формы искусственного интеллекта, который учится справляться с разными типами шума, вместо того чтобы предполагать, что все просто и однородно.

Figure 1
Figure 1.

Почему поиск направления затруднён в океане

Чтобы определить источник звука, инженеры используют ряд подводных микрофонов — гидрофонов, расположенных в линию. Сравнивая крошечные различия во времени прихода сигнала к каждому сенсору, можно оценить направление, откуда он пришёл; эта задача известна как оценка направления прихода (DOA). Классические методы предполагают, что фоновый шум похож на равномерный шорох — математически это «белый гауссовский шум». Реальные океаны редко ведут себя так аккуратно. Шум может быть импульсным, в виде резких всплесков; окрашенным, с большей энергией на некоторых частотах; или неравномерно распределённым между сенсорами. Такое сочетание типов, называемое гибридным шумом, нарушает предположения старых алгоритмов, и их точность резко падает именно в тех ситуациях, где это наиболее критично.

Более умная линия датчиков

Исследователи опираются на простую, но мощную конфигурацию датчиков: прямая линия так называемых векторных гидрофонов, которые измеряют и давление, и движение частиц в воде. Когда дальние источники излучают волны, эти волны достигают каждого сенсора с небольшими сдвигами по времени и фазе в зависимости от угла прихода. По этим измерениям система строит матрицу ковариации — компактное резюме того, как сигналы на разных сенсорах соотносятся друг с другом во времени. Эта матрица содержит геометрические подсказки, необходимые для определения направления, но она переплетена со всей сложной шумовой составляющей среды.

Преобразование зашумлённых данных в изучаемые закономерности

Нейронные сети обычно работают с действительными числами, тогда как матрица ковариации — комплекснозначная. Поэтому команда разделяет её на две действительные матрицы, представляющие вещественную и мнимую части, и подаёт их в виде двухканального «изображения» в сверточную нейронную сеть (CNN). Эта CNN сканирует матрицу в поисках пространственных закономерностей, которые отличают истинную структуру сигнала от шума. Вместо опоры на вручную сконструированные формулы CNN напрямую обучается этим признакам на данных, постепенно выстраивая от простых локальных связей к более высоким уровням представлений, полезным для локализации источников звука.

Figure 2
Figure 2.

Множество специалистов и один умный координатор

Ключевая инновация — то, что происходит после CNN: сеть sparsely-gated mixture-of-experts (SMoE). Вместо одной большой монолитной модели, пытающейся справиться со всеми ситуациями, система включает несколько более мелких экспертных сетей, каждая из которых обучена успешно работать при конкретном типе шума, например белом, розовом, красном, синем, фиолетовом или импульсном шуме. Отдельная управляющая (gating) сеть анализирует признаки, извлечённые CNN, и для каждого входного примера решает, какие несколько экспертов наиболее релевантны. Активируются только эти лучшие эксперты, и их выходы комбинируются для получения итоговой оценки вероятности наличия источника звука под каждым углом от 0° до 180°. Такой дизайн делает модель адаптивной — она меняет, к каким экспертам прислушивается по мере изменения шумовых условий — и эффективной, поскольку не требует запуска всех экспертов одновременно.

Тестирование в жёстких, реалистичных условиях

Для обучения этой системы авторы сначала сгенерировали данные так, чтобы каждый эксперт видел только один тип шума, что позволило ему специализироваться. Затем управляющая сеть обучалась на смесях всех шести шумов, имитируя реальные гибридные среды. Модель также оценивалась на большой реалистичной тестовой выборке, содержащей как моделируемый шум, так и реально записанный подводный шум, по широкому диапазону уровней сигнала и длины данных. По сравнению с известными классическими методами и другими подходами глубокого обучения модель SMoE последовательно показывала меньшие ошибки и более высокие показатели успеха, особенно в условиях сильного шума или при ограниченном объёме данных. При отношении сигнал/шум 0 дБ — когда мощность сигнала и шума равны — модель достигала среднего углового отклонения менее одного градуса, тогда как соперничающие методы могли ошибаться на многие градусы.

Что это означает для будущих подводных систем наблюдения

Проще говоря, эта работа показывает, что распределение задачи между несколькими специализированными AI «слухачами» с выбором среди них на лету может существенно улучшить нашу способность определять, откуда идут подводные звуки в хаотичных, шумных условиях. Подход можно адаптировать к другим конфигурациям датчиков помимо простой линейной решётки, а сама идея — mixture-of-experts с умным гейтом — может помочь в радиолокации, робототехнике и других областях, где требуется локализация сигналов в присутствии сложных помех. Для приложений, зависящих от надёжного подводного прослушивания — от навигации до мониторинга окружающей среды — этот метод предлагает более гибкий и устойчивый способ «услышать» сквозь шум.

Цитирование: Xu, W., Yi, S., Gu, H. et al. Underwater acoustic vector DOA estimation in hybrid noise environments based on sparsely-gated mixture-of-experts mechanism. Sci Rep 16, 6192 (2026). https://doi.org/10.1038/s41598-026-37217-3

Ключевые слова: подводная акустика, направление прихода, гибридный шум, глубокое обучение, mixture of experts