Clear Sky Science · nl

Detectie van koraalmorfologie in onderwaterbeelden met YOLOv12 door fusie van CNN- en transformer-encoder

· Terug naar het overzicht

Waarom koraalvormen ons allemaal aangaan

Koraalriffen zijn meer dan fraaie onderwaterlandschappen; hun vormen bepalen mede hoe goed ze kusten beschermen, hoe ze zeeleven bieden en hoe ze visserij en toerisme ondersteunen. Het volgen van veranderingen in deze koraalvormen in de loop van de tijd is cruciaal om de gezondheid van riffen te begrijpen in een opwarmende en meer vervuilde oceaan. Deze studie presenteert een nieuwe manier om automatisch verschillende koraalgroeivormen in onderwaterfoto’s te herkennen, waarmee onderzoekers de toestand van riffen sneller en betrouwbaarder kunnen volgen.

De uitdagingen van helder zien onder water

Het monitoren van koraalriffen berust lange tijd op duikers die foto’s handmatig labelen, een proces dat langzaam, kostbaar en gevoelig voor subjectieve beoordeling is. Onderwaterbeelden zijn moeilijk voor computers om te interpreteren omdat licht wordt geabsorbeerd en verstrooid, kleuren verschuiven en zwevende deeltjes fijne details verbergen. Verschillende koraalgroeivormen, zoals vertakte, bolvormige en platte plaatvormen, kunnen in troebel water verwarrend op elkaar lijken. Vroegere AI-hulpmiddelen hebben vaak moeite onder deze omstandigheden, missen kleine kolonies, verwarren gelijkende vormen of werken te traag voor realtimegebruik op onderzoeksrobots.

Figure 1. Hoe AI helpt verschillende koraalvormen te herkennen in troebele onderwateromgevingen voor snellere koraalrifmonitoring.
Figure 1. Hoe AI helpt verschillende koraalvormen te herkennen in troebele onderwateromgevingen voor snellere koraalrifmonitoring.

Een slimmer digitaal oog voor koraalriffen

De onderzoekers bouwen voort op een populaire familie van snelle objectdetectors, bekend als YOLO, en gebruiken de nieuwste versie, YOLOv12, als basis. Ze voegen twee complementaire componenten toe: een netwerk dat uitblinkt in het opmerken van lokale texturen en randen, en een ander dat beter is in het begrijpen van de bredere scène. De eerste component, een Convolutional Neural Network, pikt fijne visuele details op, zoals kleine koraaltwijgen en oppervlaktestructuren. De tweede, een transformer-encoder genoemd, kijkt over het hele beeld om te begrijpen hoe kolonies zijn gerangschikt en hoe ze zich onderscheiden van stenen, zand of algen. Een speciaal fusie-module combineert vervolgens deze lokale en globale signalen zodat het systeem subtiele verschillen tussen koraalvormen kan herkennen.

Hoe het systeem koraalvormen leert

Om hun model te trainen en testen gebruikt het team een openbaar beschikbare verzameling onderwaterbeelden die meerdere belangrijke koraalmorfologieën bevat: vertakt, massief en tabulair (plaatvormig). Beelden worden aangepast in formaat en geoptimaliseerd, en er worden verschillende kleur- en geometrische transformaties toegepast zodat het model veel varianten van dezelfde scène ziet, waarmee echte veranderingen in diepte, belichting en waterhelderheid worden nagebootst. Binnen de detector worden kenmerken op meerdere schalen verwerkt zodat zowel kleine koraaltoppen als grote kolonies kunnen worden gevonden. De gefuseerde informatie stroomt daarna naar een detectiefase die begrenzingsvakken rond koraalkolonies uitzet en elke kolonie toewijst aan een groeivormcategorie.

Wat de resultaten laten zien

Het gefuseerde model, genoemd YOLOv12-CT, wordt getest tegen een reeks bekende detectiesystemen, waaronder eerdere YOLO-versies, klassieke deep-learningdetectors en nieuwere transformer-gebaseerde ontwerpen. Over standaard prestatiemaatstaven — zoals hoeveel kolonies worden gevonden, hoe vaak labels correct zijn en hoe precies hun omlijningen zijn — komt de nieuwe methode als winnaar uit de bus. Het behaalt een hoge mean Average Precision bij gebruikelijke evaluatiedrempels en overtreft alle vergelijkingsmodellen, terwijl de verwerkingstijden geschikt blijven voor bijna realtimegebruik. Het systeem blijkt bijzonder sterk in het herkennen van platte, plaatachtige koralen en verbetert substantieel de detectie van complexere vertakte vormen, die doorgaans het moeilijkst te onderscheiden zijn in troebel water.

Figure 2. Hoe een AI-model fijne korAaldetails en bredere patrooninformatie van de scène samenvoegt om kolonies op groeivorm te classificeren.
Figure 2. Hoe een AI-model fijne korAaldetails en bredere patrooninformatie van de scène samenvoegt om kolonies op groeivorm te classificeren.

Wat dit betekent voor rifbescherming

Door koraalgroei nauwkeuriger en efficiënter te identificeren, maakt deze benadering het eenvoudiger om rifstructuur, biodiversiteit en veerkracht door de tijd heen bij te houden. De methode kent nog beperkingen, zoals onevenwichten in de trainingsdata en de extra rekenkosten van transformer-modules, en de prestaties kunnen variëren in zeer zware of onbekende onderwateromstandigheden. Desondanks toont de studie aan dat het combineren van gedetailleerde textuursignalen met een bredere scènewaarneming mariene wetenschappers een krachtig nieuw instrument kan bieden voor grootschalige, geautomatiseerde koraalmonitoring, wat betere beslissingen over behoud en herstel ondersteunt.

Bronvermelding: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z

Trefwoorden: koraalmorfologie, onderwaterbeeldvorming, deep learning, objectdetectie, rifmonitoring