Clear Sky Science · tr
Astım tanısı için hibrit derin öğrenme ve YAMNet özellikleri ile solunum seslerinden tanı
Tüpe Üflemek Yerine Nefesleri Dinlemek
Milyonlarca astımlı kişi için net bir tanı genellikle bir kliniğe gitmeyi ve yorucu, zaman alıcı ve sık tekrarlanması güç olabilen akciğer fonksiyon testleri yaptırmayı gerektirir. Bu çalışma çok farklı bir fikri inceliyor: bir telefon mikrofonu veya dijital stetoskop gibi basit bir cihazla kaydedilen nefes ve öksürük seslerini kullanarak kişinin astım mı yoksa başka bir akciğer hastalığı mı olduğunu belirlemek. Bu sesleri bilgisayarın tanıyabileceği desenlere dönüştürerek, araştırmacılar uzak muayeneleri ve mobil sağlık uygulamalarını destekleyebilecek doğru ve uygun maliyetli bir araç geliştirmeyi hedefliyor.

Neden Solunum Sesleri Gizli İpuçları Taşır
Astım hava yollarını etkileyerek daralmasına ve hava akışının düzensizleşmesine neden olur. Bu, doktorların geleneksel olarak stetoskopla dinlediği hırıltı (ıslık benzeri tonlar) ve çıtırtı (kısa patlama sesleri) gibi ayırt edici sesler üretir. Ancak kronik obstrüktif akciğer hastalığı (KOAH), bronşit veya zatürree gibi diğer akciğer hastalıkları da benzer sesler üretebildiğinden tanı uzmanlar için bile zor olabilir. Spirometri gibi standart testler klinik ziyaretleri, eğitimli personeli ve özel ekipmanı gerektirir ve astımın tüm çeşitlerini kaçırabilir. Yazarlar, kaydedilmiş solunum seslerinin dikkatli analizinin bu ince farklılıkları daha uygun biçimde yakalayabileceğini ve sağlıklı solunum ile birlikte çeşitli akciğer hastalıkları arasında ayrım yapmaya yardımcı olabileceğini savunuyor.
Akciğer Sesleri İçin Akıllı Bir Dinleyici İnşa Etmek
Ekip, Asthma Detection Dataset v2 adlı açık Kaggle veri kümesinden alınan gerçek dünya kayıtlarıyla başlayan bir “akıllı dinleyici” sistemi tasarladı. Bunlar günlük ortamlarda normal cep telefonlarıyla toplanmış kısa öksürük ve nefes klipleri olup astım, KOAH, zatürree, bronşit veya sağlıklı olarak etiketlenmiş. Kayıtlar uzunluk ve kalite açısından değiştiği için araştırmacılar önce onları temizliyor: ses düzeyini standartlaştırıyor, uzun sessizlikleri çıkarıyor, çok düşük ve çok yüksek frekansları filtreliyor ve tam solunum döngülerini yakalamaya yetecek sabit altı saniyelik parçalara kesiyorlar. Ayrıca sistemi laboratuvar kalitesindeki kayıtlar yerine dağınık gerçek dünya koşullarıyla başa çıkmaya alıştırmak için hafif hızlandırma/ yavaşlatma, perde kaydırma ve hafif arka plan gürültüsü ekleme gibi gerçekçi varyasyonlar da oluşturuyorlar.
İnsan Açıklamalı ve Derin Desenleri Birleştirmek
Sistemin merkezinde aynı anda iki şekilde dinleyen hibrit bir yaklaşım var. Bir dalga ses mühendisleri ve klinisyenlerin anladığı klasik ses betimleyicilerini çıkarıyor; örneğin enerjinin perdeye nasıl dağıldığı, sinyalin sıfır kesişim hızları ve ses enerjisinin zaman içinde nasıl yükselip düştüğü gibi ölçümler. Bu ölçümler hırıltı ve çıtırtıları vurgulamaya yarıyor. İkinci dalga aynı sesi Google tarafından birçok günlük ses üzerinde eğitilmiş kompakt bir derin öğrenme modeli olan YAMNet'e veriyor. YAMNet her saniyeyi elle tanımlanamayacak kadar karmaşık desenleri yakalayan zengin sayısal “parmak izi”lere dönüştürüyor. Araştırmacılar daha sonra bu iki ses görünümünü birleştirip, çok ölçekli desenlere odaklanan ve en bilgilendirici kanalları otomatik olarak vurgulayan ek modüllerden geçiriyor; nihai sınıflandırıcı da tanıyı yapıyor.

Doğruluğu Test Etmek ve Kara Kutuyu Şeffaflaştırmak
Sistemlerinin ne kadar iyi çalıştığını görmek için yazarlar, her akciğer durumunun eğitim ve test aşamalarında adil temsil edilmesini sağlayan katmanlı beş katlı çapraz doğrulama adı verilen dikkatli bir test stratejisi kullandılar. Model yaklaşık %98,6 doğruluk ve benzer derecede yüksek F1 skoru ile eğri altındaki alanda üstün performans göstererek geleneksel makine öğrenmesi modelleri, spektrogram görüntüleri üzerinde standart konvolüsyonel ağlar ve yalnızca YAMNet kullanan daha basit bir sürüm dahil olmak üzere birkaç güçlü alternatifi açıkça geride bıraktı. Önemli olarak ekip sadece başlıca sayılarla yetinmedi. Farklı durumların nasıl ayırt edici dalga formları ve spektrogram desenleri ürettiğini göstermek için görselleştirme araçları kullandılar ve her tahmini en çok etkileyen özellikleri ve ağdaki gizli birimleri vurgulamak için oyun teorisinden alınmış SHAP yöntemini uyguladılar. Bu analizler modelin hırıltı ve çıtırtılara karşılık gelen sürekli yüksek frekans bantları ve ani patlamalar gibi klinik açıdan anlamlı ipuçlarına odaklandığını ortaya koydu.
Günlük Bakım İçin Anlamı Ne Olabilir
Basitçe söylemek gerekirse, çalışma dikkatle inşa edilmiş bir derin öğrenme sisteminin, kayıtlar sıradan cihazlarda ve gürültülü ortamlarda alınmış olsa bile neredeyse uzman düzeyinde “nefesleri dinleyebileceğini” gösteriyor. Anlaşılır ses özelliklerini güçlü öğrenilmiş temsillerle harmanlayarak ve kararlarını görsel haritalar ve özellik önem puanlarıyla açıklayarak sistem gizemli bir kara kutudan ziyade güvenilir bir dijital asistana daha da yakınlaşıyor. Yine de daha fazla ve daha büyük veri kümelerinde test edilmesi ve klinik uygulamada doğrulanması gerekiyor; buna rağmen bu yaklaşım telefonlarda veya hafif donanımlarda çalışabilecek, doktorların ve hastaların astım ve ilişkili akciğer hastalıklarını hızlı, invazif olmayan ve düşük maliyetle izlemelerine yardımcı olabilecek gelecekteki araçlara işaret ediyor.
Atıf: Shatat, G.A.EL., Moustafa, H.ED., Saraya, M.S. et al. Hybrid deep learning and YAMNet features for asthma diagnosis from respiratory sounds. Sci Rep 16, 13781 (2026). https://doi.org/10.1038/s41598-026-49247-y
Anahtar kelimeler: astım tanısı, solunum sesleri, derin öğrenme, mobil sağlık, tıbbi ses analizi