Clear Sky Science · tr

Veri artırma ve aktarım öğrenmesi kullanarak stereotipik hayvan seslerinin otomatik tespiti

2026-04-23 · Dizine geri dön

Okyanustaki Gizli Sesleri Dinlemek

Dünyanın okyanusları boyunca, geniş sualtı mikrofonları sessizce ses manzarasını kaydediyor: çarpan dalgalar, gemi motorları, çatlayan buzlar — ve balinaların derin şarkıları. Bu arşivlerin içinde, nesli tehlikede olan hayvanların nerede yaşadığına, sayılarının ne olduğuna ve değişen bir gezegenle nasıl başa çıktıklarına dair ipuçları yatıyor. Yine de, insanlar için bu kadar çok sesi göz ve kulakla taramak olanaksız. Bu çalışma, yalnızca bir tane iyi kaydı bulunan çok stereotipik hayvan çağrılarını — örneğin bazı mavi balina şarkılarını — güvenilir biçimde seçebilen otomatik bir “dinleyici”yi eğitmenin yeni bir yolunu sunuyor.

Hayvan Seslerini Bulmayı Neden Bu Kadar Zor?

Bilim insanları giderek pasif akustik izlemeye dayanıyor: vahşi doğaya kayıt cihazları bırakıp daha sonra kaydı tarayarak hayvan çağrılarını bulmak. Yaygın veya gürültülü türler için modern derin öğrenme sistemleri iyi çalışıyor, ancak bunlar binlerce etiketli örnek ve güçlü bilgisayarlar gerektiriyor. Bu, çağrıları yalnızca birkaç kez kaydedilmiş nadir veya kaçamaklı hayvanlar ve büyük bilgi işlem kümelerine erişimi olmayan araştırma grupları için bir engel oluşturuyor. Buna ek olarak, okyanus kayıtları karmaşık. Fırtına, buz ve gemilerden gelen arka plan gürültüsü çağrıları boğabilir ve insan uzmanlar bile bir spektrogramdaki hangi soluk işaretlerin gerçekten bir balinaya ait olduğu konusunda sıklıkla görüş ayrılığı yaşayabiliyor.

Neredeyse Hiçten Büyük Bir Eğitim Seti Oluşturmak

Yazarlar, her bireyin neredeyse aynı sesi ürettiği, yani yüksek derecede tekrarlanabilir veya “stereotipik” çağrılar üreten hayvanlara odaklandı. Hedef çağrının yalnızca bir veya birkaç temiz örneğinden başlayıp binlerce gerçekçi varyant yaratan yarı-sentetik bir eğitim hattı geliştirdiler. Standart ses işleme kullanılarak, sistem her çağrıyı zamanda hafifçe uzatıyor veya sıkıştırıyor, şarkıdaki uzun vadeli değişimleri taklit etmek için perdesini kaydırıyor, hafif bozulmalar ve yankılar ekliyor ve gerçek okyanus arka plan gürültüsü ile karıştırıyor. Kritik olarak, tüm bu değişiklikler bilinen balina davranışı ve ses yayılımı bilgilerine dayanıyor, böylece sentetik çağrılar hâlâ gerçek bir balinanın üretebileceği bir şeye benziyor ve öyle duyuluyor.

Mevcut Bir Sinir Ağını Yeniden Kullanmak

Bir dedektörü sıfırdan eğitmek yerine ekip aktarım öğrenmesini kullandı: insan konuşmasını tespit etmek üzere tasarlanmış bir sinir ağı ile başlayıp bunu balina şarkılarına ince ayar yaptılar. Bu ağ sesi kısa, örtüşen spektrogram “çerçeveleri” dizisi olarak ele alıyor ve farklı uzunluktaki çağrılarla başa çıkmasını sağlayan zamana bağlı desenleri takip edebilen tekrarlayan katmanlar içeriyor. Eğitim yalnızca tüketici sınıfı donanım — mütevazı bir grafik kartına sahip standart bir dizüstü bilgisayar — kullanılarak yapıldı ve yaklaşık beş saatte tamamlandı. Eğitildikten sonra sistem, tüm önişleme ve sonişlem dahil olmak üzere yaklaşık bir buçuk dakikada dört saatlik okyanus kaydını tarayabiliyordu.

Dedektörü Sınamaya Koymak

Yöntem, nesli tehlikede olan mavi balinaların iki çok farklı düşük frekanslı çağrısı üzerinde değerlendirildi: Antarktik mavi balinaların basit, alçalan “Z-çağrısı” ve Hint Okyanusu’ndaki Chagos cüce mavi balinalarının daha karmaşık, çok parçalı şarkısı. Her iki durumda da dedektör tamamen yarı-sentetik verilerle eğitildi. Bir model için eğitim seti yalnızca Chagos şarkısının tek bir gerçek örneğinden oluşturuldu. Performansı adil bir şekilde değerlendirmek için yazarlar, birçok çağrıyı kaçırdığı ortaya çıkan mevcut “zemin gerçeği” anotasyon kayıtlarına körü körüne güvenmediler. Bunun yerine, deneyimli bir analist dedektör ile kayıtlar arasındaki binlerce anlaşmazlığı manuel olarak gözden geçirdi. Bu karar sürecinden sonra, en iyi Chagos modeli hedef çağrıların %99,4’ünü doğru şekilde bulurken %91,2 doğruluk sağladı; Antarktik model ise hem net çağrıları hem de yoğun koro durumlarını sayan kapsayıcı puanlamada %87 tespit oranı ve %65 doğruluk elde etti.

Sonuçların Koruma İçin Anlamı

Bir uzmanın olmayan gözünde, bu sayılar dedektörün devasa arşivleri tarayabileceği ve neredeyse tüm belirtilen balina şarkısı olaylarını, nispeten az yanlış alarma rağmen, tek bir iyi kayıttan eğitilmiş olsa bile güvenilir şekilde işaretleyebileceği anlamına geliyor. Bu, sesleri nadiren yakalanan az bilinen ve tehdit altındaki türleri incelemek için büyük bir ilerlemedir. Yazarlar, başarının neyin “vuruş” sayılacağına — örneğin örtüşen koroların dahil edilip edilmeyeceğine — dair açık tercihlere ve hem pozitif hem negatif eğitim örneklerinin dikkatli tasarımına bağlı olduğunu vurguluyor. Ayrıca uzman insan etiketlerinin bile kusursuz olmadığını ve dedektörleri değerlendirmek için daha iyi standartlara hâlâ ihtiyaç olduğunu belirtiyorlar. Yine de, bu çerçeve, zeki veri artırma ve aktarım öğrenmesiyle, koruma için güçlü dinleme araçlarının ucuzca inşa edilip açıkça paylaşılabileceğini gösteriyor; bu da bilim insanlarının küresel akustik arşivlerimizde zaten depolanmış olan gizli sesleri ortaya çıkarmasına yardımcı olabilir.

Atıf: Jancovich, B.A., Sanchez, V., Truong, G. et al. Automated detection of stereotyped animal sounds using data augmentation and transfer learning. Sci Rep 16, 13137 (2026). https://doi.org/10.1038/s41598-026-48308-6

Anahtar kelimeler: pasif akustik izleme, mavi balina şarkıları, derin öğrenme dedektörü, sentetik eğitim verisi, yaban hayatı koruma