Clear Sky Science · tr

YOLO-Starfish: karmaşık sualtı özelliklerini öğrenen balık nesne tespiti

· Dizine geri dön

Neden su altında balıkları tespit etmek bu kadar zor?

İklim değişikliğinden aşırı avlanmaya kadar su yüzeyinin altında olanları anlamak hayati öneme sahip. Bilim insanları ve balıkçılık yöneticileri giderek daha fazla balıkları saymak ve tanımlamak için sualtı kameralarına güveniyor, ancak toplanan görüntüler çoğu zaman bulanık, mavi‑yeşil tonlu ve birbirinin üstüne binen hayvanlarla dolu oluyor. Binlerce saatlik videonun elle incelenmesi yavaş ve hataya açık. Bu makale, sualtı robotları ve kameraların bu zorlu koşullarda balıkları otomatik olarak bulmasına yardımcı olmak üzere tasarlanmış kompakt bir yapay zeka sistemi olan YOLO‑Starfish’i ve tatlı su balıklarının yeni, ayrıntılı görüntü veri setini tanıtıyor.

Figure 1
Figure 1.

Bir kameranın gözünden sualtı dünyası

Sualtı nesne tespiti, su eklentisi yapılmış sıradan bir görüntü analizi değil. Nehirlerde ve göllerde ışığın davranışı çok farklıdır: kırmızı dalga boyları hızla yok olur, partiküller ışığı birçok yöne saçar ve görünürlük metrelik mesafelerde temizden bulanığa değişebilir. Balıklar da ayrı bir zorluk katmanı oluşturur. Farklı türler çok benzer görünebilir, aynı türe ait bireyler küçük yavrulardan büyük yetişkinlere kadar değişir ve sıkça üst üste biner, bitkilerin arasında saklanır veya gölgeye girip çıkarlar. Mevcut birçok yapay zeka yaklaşımı nispeten temiz, iyi aydınlatılmış görüntülerde eğitildiği için bu karmaşık sahnelerle nadiren karşılaşır ve sahada uygulandıklarında zorlanırlar.

Gerçeğe yakın bir balık fotoğraf koleksiyonu oluşturmak

Bu boşluğu kapatmak için yazarlar önce Underwater Freshwater Fish Dataset (UFFD) adlı, gerçek dünyadan büyük bir sualtı görüntü koleksiyonu derlediler. Farklı tatlı su habitatlarından kamuya açık videolar topladılar, düzenli aralıklarla kareler otomatik olarak çıkardılar ve sonra yüksek kaliteli görüntüleri titizlikle seçip etiketlediler. Sadece birkaç ünlü sazan türüne odaklanmak yerine her tanınabilir balığı etiketlemeye karar verdiler ve güvenle tanımlanamayan bireyler için bir "bilinmeyen balık" sınıfı dahil olmak üzere 19 kategoriyle sonuçlandılar. Nihai veri seti 18.594 görüntü (16.904 benzersiz) içeriyor; su berraklığı, aydınlatma koşulları, kamera mesafeleri ve balık boyutları bakımından geniş bir çeşitliliği kapsıyor. Önemli olarak, tür sayıları "uzun kuyruklu" bir düzen izliyor: birkaç tür yaygınken birçok tür nadir — tıpkı gerçek ekosistemlerde olduğu gibi.

Figure 2
Figure 2.

Bozulmuş görüntüleri okumada daha akıllıca bir yol

Bu veri setinin üzerine ekip, popüler gerçek zamanlı algılayıcı YOLOv8’in geliştirilmiş bir versiyonu olan YOLO‑Starfish’i inşa etti. İyileştirmenin arkasındaki iki temel fikir var. Birincisi, C2Star modülü ağın iç özellikleri nasıl birleştirdiğini değiştiriyor. Desenleri basitçe toplamak yerine, onları öğe bazında çarpıyor — sözde bir "yıldız işlemi" ile. Bu, sinyallerin su içinde ilerlerken görece nasıl ölçeklendiğini, sadece gürültüye gömülmediklerini yansıtır. Matematiksel olarak bu çarpma, ağın hacimli hale gelmeden daha karmaşık şekil ve renk kombinasyonlarını temsil etmesine izin veriyor; bu, sınırlı hesaplama gücüne ve pil kapasitesine sahip sualtı robotları için hayati önem taşıyor.

Ağın gerçekten neyin önemli olduğuna karar vermesine izin vermek

İkinci yenilik, Dikkat‑Yönelimli Geliştirme Modülü (ADEM), her görüntüde hangi bilginin güvenilir olduğunu vurguluyor. Su genellikle bazı renk kanallarını—özellikle kırmızıyı—yok ettiği için, her rengi eşit muamele etmek algılayıcıyı yanlış yönlendirebilir. ADEM, tüm renk‑kanalı bilgisini bu kanalların genel güvenilirliğini tahmin eden tek bir yönlendirici değere sıkıştırıyor. Ardından bu küresel ipucunu, görüntüdeki belirli bölgelere vurgu yapan mekânsal dikkat ile birleştiriyor ve basit bir toplama yerine "maksimumu al" kuralını kullanıyor. Renk ipuçlarının güçlü olduğu sahnelerde model kanal bilgisine daha çok yaslanıyor; renkler soluk olduğunda ise şekil ve kenar gibi mekânsal desenlere daha fazla güveniyor. Ortaya çıkan dikkat haritası, görüntü genelinde özellikleri esnek ve veriye dayalı bir şekilde güçlendirmek veya bastırmak için kullanılıyor.

YOLO‑Starfish ne kadar iyi çalışıyor?

Yazarlar YOLO‑Starfish’i üç kıyaslama üzerinde test ettiler: yeni UFFD veri setleri, mevcut bir sualtı veri seti (RUOD) ve yaygın kullanılan genel amaçlı COCO2017 koleksiyonu. Üçünde de C2Star ve ADEM eklemek, baz model YOLOv8’e kıyasla tespit skorlarını genellikle birkaç puan artırdı ve model parametre sayısını ve hesaplamayı hafifçe azalttı. Kazanımlar özellikle UFFD’deki zor vakalarda belirgindi; az eğitim örneği olan nadir "kuyruk" türleri ve yakalayıcı "bilinmeyen balık" kategorisi gibi durumlarda genelgeleştirme yeteneğinin arttığını gösterdi. COCO2017 üzerinde de YOLO‑Starfish, diğer son teknoloji küçük modellerle rekabet etti; bu da iyileştirmelerin sualtı görüntüleriyle sınırlı kalmayıp daha geniş kullanım alanlarına uygun olduğunu gösteriyor.

Su izleme bakımından bunun anlamı nedir?

Özetle çalışma, dikkatle tasarlanmış yapay zekanın temiz laboratuvar görüntüleri ile yüzeyin altındaki dağınık, renk bozulmalı dünya arasındaki uçurumu kapatabileceğini gösteriyor. Gerçeğe yakın bir tatlı su balığı veri setini fiziksel ilhamlı özellik işleme (C2Star) ve uyarlanabilir dikkat (ADEM) ile eşleştirerek, YOLO‑Starfish ağır donanım gerektirmeden daha doğru balık tespiti sunuyor. Ekologlar, balıkçılık yöneticileri ve robotik uzmanları için bu tür bir araç, sualtı ekosistemlerinin uzun vadeli ve geniş çaplı izlenmesini çok daha pratik hale getirebilir ve sualtı yaşamının nasıl değiştiğine dair daha net, otomatik bir görünüm sağlayabilir.

Atıf: Gong, R., Xu, J., Zheng, Z. et al. YOLO-Starfish: fish object detection learning complex underwater features. Sci Rep 16, 13964 (2026). https://doi.org/10.1038/s41598-026-44187-z

Anahtar kelimeler: sualtı balık tespiti, bilgisayarlı görme, derin öğrenme, su ekolojisi, robotik izleme