Clear Sky Science · tr
YOLOv12 ile CNN ve dönüştürücü (transformer) kodlayıcı füzyonunu kullanarak su altı görüntülerinde mercan morfolojisi tespiti
Mercan şekillerinin hepimiz için önemi
Mercan resifleri sadece göze hoş gelen su altı manzaraları değildir; şekilleri kıyıları ne kadar iyi koruduklarını, deniz yaşamını nasıl barındırdıklarını ve balıkçılık ile turizmi nasıl desteklediklerini belirler. Bu mercan şekillerinin zaman içinde nasıl değiştiğini izlemek, ısınan ve daha kirli bir okyanusta resif sağlığını anlamak için anahtar önemdedir. Bu çalışma, su altı fotoğraflarında farklı mercan büyüme biçimlerini otomatik olarak tespit etmenin yeni bir yolunu sunar; böylece araştırmacılar resif durumunu daha hızlı ve daha güvenilir şekilde izleyebilir.
Su altında net görmekteki zorluklar
Mercan resiflerinin izlenmesi uzun süre dalgıçların fotoğrafları tek tek etiketlemesine dayanmıştır; bu süreç yavaş, maliyetli ve kişisel değerlendirmelere açıktır. Işık emildiği ve saçıldığı, renkler kaydığı ve asılı parçacıkların ince detayları gizlediği için su altı görüntüleri bilgisayarlar için yorucudur. Dallanmış, kubbe benzeri ve düz plaka şeklindeki farklı mercan büyüme biçimleri bulanık suda birbirine kafa karıştırıcı şekilde benzeyebilir. Önceki yapay zekâ araçları bu koşullarda sık sık zorlanır; küçük kolonileri kaçırır, benzer görünen formları karıştırır veya inceleme robotlarında gerçek zamanlı kullanım için çok yavaş çalışır.

Mercan resifleri için daha akıllı bir dijital göz
Araştırmacılar, temel olarak en yeni sürüm olan YOLOv12'yi kullanan hızlı nesne algılayıcıların popüler ailesi üzerine inşa ediyor. Buna iki tamamlayıcı bileşen ekliyorlar: yerel dokuları ve kenarları fark etmede üstün olan bir ağ türü ve daha geniş sahneyi kavramada güçlü olan başka bir yapı. İlk bileşen, Konvolüsyonel Sinir Ağı, küçük mercan dalları ve yüzey desenleri gibi ince görsel ayrıntıları yakalar. İkinci bileşen, dönüştürücü (transformer) kodlayıcı, kolonilerin nasıl düzenlendiğini ve kayalardan, kumdan veya alglerden nasıl ayrıldıklarını anlamak için tüm görüntüye bakar. Özel bir füzyon modülü daha sonra bu yerel ve küresel sinyalleri birleştirir, böylece sistem mercan şekilleri arasındaki ince farklılıkları tanıyabilir.
Sistemin mercan şekillerini nasıl öğrendiği
Modeli eğitmek ve test etmek için ekip, dallanma, büyük kütle (massive) ve tabular (plak) gibi birkaç kilit mercan morfolojisini içeren halka açık bir su altı görüntü koleksiyonunu kullanır. Görüntüler yeniden boyutlandırılır ve geliştirilir; modelin aynı sahnenin birçok versiyonunu görmesi için çeşitli renk ve geometrik değişiklikler uygulanır; bu, derinlik, aydınlatma ve su berraklığındaki gerçek dünya değişimlerini taklit eder. Dedektör içinde, hem küçük mercan uçları hem de büyük koloniler bulunabilsin diye özellikler çoklu ölçeklerde işlenir. Füzyonla birleştirilen bilgiler daha sonra etrafına sınırlayıcı kutular (bounding box) çizilen mercan kolonilerini çıktılayan ve her birini bir büyüme-formu kategorisine atayan bir tespit aşamasına akar.
Sonuçlar ne gösteriyor
YOLOv12-CT adı verilen füzyonlu model, önceki YOLO sürümleri, klasik derin öğrenme dedektörleri ve daha yeni dönüştürücü tabanlı tasarımlar dahil olmak üzere iyi bilinen bir dizi tespit sistemiyle karşılaştırılır. Kolonilerin ne kadarının bulunduğu, etiketlerin ne sıklıkla doğru olduğu ve konturların ne kadar hassas yerleştirildiği gibi standart performans ölçütleri genelinde yeni yöntem öne çıkar. Tipik değerlendirme eşiklerinde yüksek bir ortalama Hassasiyet (mean Average Precision) elde eder; karşılaştırılan tüm modelleri geride bırakırken işlem sürelerini yakın gerçek zamanlı kullanıma uygun seviyede tutar. Sistem, özellikle düz, plaka benzeri mercanları tanımada güçlüdür ve genellikle bulutlu sularda ayırt etmesi en zor olan karmaşık dallanma formlarının tespitini önemli ölçüde iyileştirir.

Resif koruması için bunun anlamı
Mercanların nasıl büyüdüğünü daha doğru ve verimli şekilde tanımlayarak bu yaklaşım, zaman içinde resif yapısını, biyolojik çeşitliliği ve dirençliliği izlemeyi kolaylaştırır. Yöntem hâlâ eğitim verilerindeki dengesizlikler ve dönüştürücü modüllerin ek hesaplama maliyeti gibi sınırlamalarla karşı karşıyadır ve performans çok zorlu veya tanıdık olmayan su altı ortamlarında değişebilir. Yine de çalışma, ayrıntılı doku ipuçlarını daha geniş bir sahne görüşüyle harmanlamanın, deniz bilimcilerine büyük ölçekli otomatik mercan izleme için güçlü yeni bir araç sağlayabileceğini ve koruma ile restorasyon konusunda daha iyi kararları destekleyebileceğini gösterir.
Atıf: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z
Anahtar kelimeler: mercan morfolojisi, su altı görüntüleme, derin öğrenme, nesne tespiti, resif izlemesi