Clear Sky Science · nl

Onderwater akoestische vector DOA-schatting in hybride ruisomgevingen gebaseerd op een sparsely-gated mixture-of-experts-mechanisme

· Terug naar het overzicht

Luisteren naar verborgen signalen onder water

Schepen, onderzeeërs, onderwaterrobots en zelfs mariene biologen vertrouwen erop dat ze zwakke geluiden in de oceaan opvangen om te bepalen waar die vandaan komen. Maar de zee is een lawaaierige omgeving: motoren, golven, dieren en instrumenten zelf voegen allemaal storingen toe. Deze studie presenteert een nieuwe manier om de richting van onderwatersignalen te bepalen, zelfs wanneer de ruis rommelig en onvoorspelbaar is, met behulp van een moderne vorm van kunstmatige intelligentie die leert omgaan met verschillende soorten ruis in plaats van te veronderstellen dat alles eenvoudig en uniform is.

Figure 1
Figure 1.

Waarom richtingsbepaling in de oceaan zo moeilijk is

Om een geluidsbron te lokaliseren gebruiken ingenieurs een rij onderwatermicrofoons, zogenaamde hydrofoons, op een lijn. Door de kleine verschillen te vergelijken in wanneer een geluid elke sensor bereikt, kunnen ze de richting schatten waaruit het geluid is gekomen — een taak die direction-of-arrival (DOA)-schatting wordt genoemd. Klassieke methoden veronderstellen dat de achtergrondruis lijkt op een zachte, gelijkmatige sus — wiskundig gezien “wit Gaussiaanse ruis”. In werkelijkheid gedraagt de oceaan zich zelden zo netjes. Ruis kan impulsief zijn, zoals plotselinge knallen; gekleurd, met meer energie bij bepaalde frequenties; of ongelijk verdeeld over sensoren. Deze mix van gedragingen, aangeduid als hybride ruis, doorbreekt de aannames waar oudere algoritmen op vertrouwen, waardoor hun nauwkeurigheid instort juist wanneer de omstandigheden het moeilijkst zijn.

Een slimmer luisterende sensorkaart

De onderzoekers baseren hun werk op een eenvoudige maar krachtige sensoropstelling: een rechte lijn van zogenaamde vectorhydrofoons, die zowel druk als deeltjesbeweging in het water meten. Wanneer verre geluidsbronnen golven uitzenden, bereiken die golven elke sensor op iets andere tijden en met andere fases, afhankelijk van de aankomstrichting. Uit deze metingen bouwt het systeem een covariantiematrix — een compacte samenvatting van hoe de signalen bij verschillende sensoren zich in de tijd tot elkaar verhouden. Deze matrix bevat de geometrische aanwijzingen die nodig zijn om richting af te leiden, maar is verstrengeld met alle complexe ruis in de omgeving.

Ruisige data omzetten in leerbare patronen

Neurale netwerken werken meestal met reële getallen, maar de covariantiematrix heeft complexe waarden. Het team splitst de matrix daarom in twee reële matrices, die de reële en imaginaire delen voorstellen, en voert ze als een tweekanaals "afbeelding" in een convolutioneel neuraal netwerk (CNN). Dit CNN scant de matrix om ruimtelijke patronen te ontdekken die de echte signaalstructuur van ruis onderscheiden. In plaats van te vertrouwen op handmatig ontworpen formules leert het CNN deze kenmerken direct uit data, en bouwt het geleidelijk op van eenvoudige lokale relaties naar hoger-niveaupatronen die informatief zijn voor het lokaliseren van geluidsbronnen.

Figure 2
Figure 2.

Vele specialisten en één slimme coördinator

De belangrijkste innovatie is wat er na het CNN gebeurt: een sparsely-gated mixture-of-experts (SMoE)-netwerk. In plaats van één groot, monolithisch model dat probeert elke situatie aan te kunnen, bevat het systeem meerdere kleinere expert-netwerken, elk getraind om uit te blinken onder een specifiek ruisstype, zoals witte, roze, rode, blauwe, violette of impulsieve ruis. Een apart gating-netwerk kijkt naar de door het CNN geëxtraheerde kenmerken en beslist voor elk binnenkomend voorbeeld welke paar experts het meest relevant zijn. Alleen die topexperts worden geactiveerd en hun outputs worden gecombineerd om een uiteindelijke schatting te produceren van hoe waarschijnlijk het is dat een geluidsbron zich bij elke hoek tussen 0° en 180° bevindt. Dit ontwerp maakt het model zowel adaptief — omdat het verandert welke experts het raadpleegt naarmate de ruiscondities variëren — als efficiënt, omdat het voorkomt dat alle experts altijd worden uitgevoerd.

Testen onder zware, realistische omstandigheden

Om dit systeem te trainen genereerden de auteurs eerst gegevens waarbij elke expert slechts één ruissoort te zien kreeg, zodat deze kon specialiseren. Daarna trainden ze het gating-netwerk op mengsels van alle zes ruisen, als nabootsing van echte hybride omgevingen. Ze evalueerden het model ook op een grote, realistische testset die zowel gesimuleerde ruis als daadwerkelijk opgenomen onderwaterruis bevat, over een breed scala aan signaalsterktes en datalengtes. Vergeleken met bekende klassieke technieken en andere deep learning-benaderingen leverde het SMoE-model consequent kleinere fouten en hogere succespercentages, met name wanneer de ruis sterk was of wanneer slechts een beperkte hoeveelheid data beschikbaar was. Bij een signaal-ruisverhouding van 0 dB — waar signaal- en ruisvermogen gelijk zijn — behaalde het model een gemiddelde hoekfout van minder dan één graad, terwijl concurrerende methoden er vele graden naast konden zitten.

Wat dit betekent voor toekomstige onderwaterwaarneming

Simpel gezegd toont dit werk aan dat het laten samenwerken van meerdere gespecialiseerde AI-"luisteraars" en het dynamisch kiezen tussen hen onze capaciteit om te bepalen waar onderwatersignalen vandaan komen in chaotische, lawaaierige omstandigheden aanzienlijk kan verbeteren. De aanpak kan worden aangepast aan andere sensoropstellingen dan eenvoudige lineaire arrays, en hetzelfde idee — mixture-of-experts met een slimme gate — kan helpen in radar, robotica en andere velden waar signalen gelokaliseerd moeten worden in de aanwezigheid van complexe interferentie. Voor toepassingen die afhankelijk zijn van betrouwbaar onderwaterluisteren, van navigatie tot milieubewaking, biedt deze methode een flexibeler en robuuster middel om door de ruis heen te horen.

Bronvermelding: Xu, W., Yi, S., Gu, H. et al. Underwater acoustic vector DOA estimation in hybrid noise environments based on sparsely-gated mixture-of-experts mechanism. Sci Rep 16, 6192 (2026). https://doi.org/10.1038/s41598-026-37217-3

Trefwoorden: onderwaterakoestiek, aankomstrichting, hybride ruis, deep learning, mixture of experts