Clear Sky Science · sv

Upptäckt av korallmorfologi i undervattensbilder med YOLOv12 och fusion av CNN- och transformer-encoder

· Tillbaka till index

Varför korallformer betyder något för oss alla

Korallrev är mer än vackra undervattenslandskap; deras former avgör hur väl de skyddar kuster, ger skydd åt marina arter och stöder fiske och turism. Att följa hur dessa korallformer förändras över tid är avgörande för att förstå revhälsa i ett varmare och mer förorenat hav. Denna studie presenterar ett nytt sätt att automatiskt upptäcka olika koralltillväxtformer i undervattensfoton, vilket hjälper forskare att följa revens tillstånd snabbare och mer tillförlitligt.

Utmaningar med att se klart under vatten

Övervakning av korallrev har länge förlitats på dykare som mödosamt märker upp foton för hand, en process som är långsam, kostsam och påverkad av subjektiva bedömningar. Undervattensbilder är svåra för datorer att tolka eftersom ljus absorberas och sprids, färger skiftar och uppvirvlat material döljer fina detaljer. Olika koralltillväxtformer som greniga, kupolformade och platta skivliknande former kan se förvillande lika ut i grumligt vatten. Tidigare artificiella intelligensverktyg kämpar ofta i dessa förhållanden, missar små kolonier, blandar ihop liknande former eller är för långsamma för realtidsanvändning på undersökningsrobotar.

Figure 1. Hur AI hjälper till att urskilja olika korallformer i grumliga undervattensscener för snabbare övervakning av rev.
Figure 1. Hur AI hjälper till att urskilja olika korallformer i grumliga undervattensscener för snabbare övervakning av rev.

Ett smartare digitalt öga för korallrev

Forskarna bygger vidare på en populär familj av snabba objektdetektorer kända som YOLO, och använder den senaste versionen, YOLOv12, som bas. De lägger till två kompletterande komponenter: en typ av nätverk som är skickligt på att upptäcka lokala texturer och kanter, och en annan som är bra på att förstå den övergripande scenen. Den första komponenten, ett Convolutional Neural Network, fångar upp fina visuella detaljer som små korallgrenar och ytmönster. Den andra, kallad en transformer-encoder, ser över hela bilden för att förstå hur kolonier är ordnade och hur de skiljer sig från stenar, sand eller alger. En särskild fusionsmodul kombinerar sedan dessa lokala och globala signaler så att systemet kan känna igen subtila skillnader mellan korallformer.

Hur systemet lär sig korallformer

För att träna och testa sin modell använder teamet en offentligt tillgänglig samling undervattensbilder som innehåller flera nyckelmorfologier: grenig, massiv och tabulär. Bilderna skalas om och förbättras, och en mängd färg- och geometriska variationer appliceras så att modellen ser många versioner av samma scen, vilket efterliknar verkliga förändringar i djup, ljus och vattnets klarhet. Inuti detektorn bearbetas funktioner i flera skalor så att både små korallspetsar och stora kolonier kan upptäckas. Den fusionerade informationen skickas sedan vidare till ett detektionssteg som levererar omslutningsrutor runt korallkolonier och klassificerar varje ruta efter tillväxtform.

Vad resultaten visar

Den fusionerade modellen, kallad YOLOv12-CT, testas mot en rad välkända detektionssystem, inklusive tidigare YOLO-versioner, klassiska deep learning-detektorer och nyare transformerbaserade konstruktioner. Över standardmått för prestanda, såsom hur många kolonier som hittas, hur ofta etiketter är korrekta och hur exakt deras konturer placeras, kommer den nya metoden i topp. Den uppnår hög medelprecision (mean Average Precision) vid typiska utvärderingströsklar och överträffar alla jämförda modeller samtidigt som bearbetningstiderna hålls lämpliga för nästan realtidsbruk. Systemet visar sig särskilt starkt på att känna igen platta, skivlika koraller, och förbättrar avsevärt detekteringen av mer intrikata, greniga former som vanligtvis är svårast att urskilja i grumligt vatten.

Figure 2. Hur en AI-modell kombinerar fina koralldetaljer och övergripande scenmönster för att sortera kolonier efter deras tillväxtform.
Figure 2. Hur en AI-modell kombinerar fina koralldetaljer och övergripande scenmönster för att sortera kolonier efter deras tillväxtform.

Vad detta betyder för revskydd

Genom att mer precist och effektivt identifiera hur koraller växer gör detta tillvägagångssätt det enklare att följa revens struktur, biologiska mångfald och motståndskraft över tid. Metoden har fortfarande begränsningar, såsom obalanser i träningsdata och den ökade beräkningskostnaden för transformer-moduler, och prestandan kan variera i mycket svåra eller ovanliga undervattensmiljöer. Ändå visar studien att en kombination av detaljerade textursignaler och en bredare scenöverblick kan ge marinbiologer ett kraftfullt nytt verktyg för storskalig, automatiserad korallövervakning, vilket stödjer bättre beslut om bevarande och restaurering.

Citering: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z

Nyckelord: korallmorfologi, undervattensavbildning, deep learning, objektdetektering, revövervakning