Clear Sky Science · pl
Wykrywanie morfologii koralowców na zdjęciach podwodnych z użyciem YOLOv12 przez fuzję enkodera CNN i transformera
Dlaczego kształty koralowców mają znaczenie dla nas wszystkich
Rafy koralowe to coś więcej niż ładna podwodna sceneria; ich kształty wpływają na to, jak dobrze chronią wybrzeża, zapewniają schronienie organizmom morskim oraz wspierają rybołówstwo i turystykę. Obserwowanie, jak te kształty zmieniają się w czasie, jest kluczowe dla oceny stanu raf w ocieplającym się i bardziej zanieczyszczonym oceanie. W badaniu przedstawiono nową metodę automatycznego rozpoznawania różnych form wzrostu koralowców na zdjęciach podwodnych, pomagając naukowcom śledzić stan raf szybciej i bardziej niezawodnie.
Trudności z widzeniem pod wodą
Monitoring raf koralowych od dawna polega na nurkach, którzy ręcznie oznaczają zdjęcia — proces ten jest powolny, kosztowny i zależny od subiektywnych ocen. Obrazy podwodne są trudne do przetworzenia przez komputery, ponieważ światło jest pochłaniane i rozpraszane, barwy ulegają przesunięciom, a zawiesiny maskują drobne detale. Różne formy wzrostu koralowców, takie jak rozgałęzione, masywne czy płaskie talerzowe, mogą wyglądać myląco podobnie w mętnej wodzie. Wcześniejsze narzędzia AI często mają z tym problemy: pomijają małe kolonie, mylą podobne formy lub działają zbyt wolno, by nadawać się do użycia w czasie rzeczywistym na robotach badawczych.

Bardziej inteligentne cyfrowe oko dla raf
Naukowcy bazują na popularnej rodzinie szybkich detektorów obiektów znanych jako YOLO, wykorzystując najnowszą wersję, YOLOv12, jako fundament. Dodają dwa uzupełniające się komponenty: sieć, która dobrze wychwytuje lokalne tekstury i krawędzie, oraz drugą, która lepiej rozumie szerszą strukturę sceny. Pierwszy komponent, konwolucyjna sieć neuronowa (CNN), wyłapuje drobne detale wizualne, takie jak małe gałązki koralowców i wzory na powierzchni. Drugi, zwany enkoderem transformera, analizuje całość obrazu, by zrozumieć, jak kolonie są rozmieszczone i jak odróżniają się od skał, piasku czy glonów. Specjalny moduł fuzji łączy te sygnały lokalne i globalne, dzięki czemu system potrafi rozpoznawać subtelne różnice między kształtami koralowców.
Jak system uczy się kształtów koralowców
Aby trenować i testować model, zespół używa publicznie dostępnego zbioru zdjęć podwodnych, który obejmuje kilka kluczowych morfologii koralowych: rozgałęzione, masywne i talerzowe. Obrazy są zmieniane rozmiarem i ulepszane, a także poddawane różnym modyfikacjom kolorystycznym i geometrycznym, tak aby model widział wiele wersji tej samej sceny, naśladując rzeczywiste zmiany głębokości, oświetlenia i przejrzystości wody. W detektorze cechy są przetwarzane na wielu skalach, tak aby można było wykryć zarówno małe końcówki koralowe, jak i duże kolonie. Zintegrowane informacje trafiają następnie do etapu wykrywania, który zwraca ramki ograniczające wokół kolonii i przypisuje każdej kategorii formę wzrostu.
Co pokazują wyniki
Model z fuzją, nazwany YOLOv12-CT, jest testowany w porównaniu z szeregiem dobrze znanych systemów detekcji, w tym wcześniejszymi wersjami YOLO, klasycznymi detektorami głębokiego uczenia oraz nowszymi projektami opartymi na transformerach. W standardowych miarach wydajności, takich jak liczba wykrytych kolonii, trafność oznaczeń oraz precyzja lokalizacji obrysów, nowa metoda wypada najlepiej. Osiąga wysoką średnią precyzję (mAP) przy typowych progu ewaluacyjnych, przewyższając wszystkie modele porównawcze, przy jednoczesnym utrzymaniu czasów przetwarzania odpowiednich do zastosowań bliskich rzeczywistości. System jest szczególnie silny w rozpoznawaniu płaskich, talerzowych koralowców i znacząco poprawia wykrywanie bardziej złożonych form rozgałęzionych, które zwykle są najtrudniejsze do rozróżnienia w zamglonej wodzie.

Co to oznacza dla ochrony raf
Dzięki dokładniejszemu i wydajniejszemu identyfikowaniu sposobu wzrostu koralowców, podejście to ułatwia śledzenie struktury raf, bioróżnorodności i odporności w czasie. Metoda nadal napotyka ograniczenia, takie jak niezrównoważenie danych treningowych i dodatkowe koszty obliczeniowe związane z modułami transformera, a wydajność może się różnić w bardzo trudnych lub nietypowych warunkach podwodnych. Mimo to badanie pokazuje, że łączenie szczegółowych wskazówek teksturalnych z szerszym spojrzeniem na scenę może dać naukowcom morskim potężne nowe narzędzie do automatycznego monitoringu koralowców na dużą skalę, wspierając lepsze decyzje w zakresie ochrony i przywracania środowiska.
Cytowanie: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z
Słowa kluczowe: morfologia koralowców, obrazowanie podwodne, uczenie głębokie, wykrywanie obiektów, monitoring raf