Clear Sky Science · tr

EfficientNetB0 füzyon teknikleriyle çok sınıflı göz hastalığı sınıflandırması için derin öğrenme

2026-02-13 · Dizine geri dön

Neden erken göz kontrolleri önemli

Görme kaybı genellikle sessizce ilerler. Katarakt, glokom ve diyabetin retinaya verdiği zarar gibi yaygın göz sorunları semptomlar belirginleşmeden uzun süre önce görüşü çalabilir. Dünyada, özellikle kırsal veya düşük gelirli bölgelerde herkesin zamanında muayene edilebilmesi için yeterli göz uzmanı yok. Bu çalışma, gözün arkasının fotoğraflarını okuyan akıllı bir bilgisayar sisteminin, modern görüntü arama ve yüz tanıma gibi yapay zekâ tekniklerini kullanarak birkaç önemli göz hastalığını erken ve güvenilir biçimde tespit etmede doktorlara nasıl yardımcı olabileceğini araştırıyor.

Hastalığı tek bir çekimde görmek

Göz hekimleri hastalığı görmek için zaten retina—gözün arkasındaki ışığa duyarlı tabaka—üzerine çekilmiş renkli fotoğrafları kullanıyor. Bu görüntülerde katarakt optik yolun bulutlanması olarak, glokom optik sinirin şeklini değiştirerek ve diyabetik retinopati retinayı küçük sızıntılar ve izlerle kaplayarak kendini gösterir. Araştırmacılar, dörtlü gruplar halinde dengelenmiş 4.217 yüksek çözünürlüklü retina görüntüsü topladı: sağlıklı gözler, katarakt, glokom ve diyabetik retinopati. Birkaç açık kaynaktan derlenmiş dengeli bir koleksiyonla çalışarak, bilgisayarın gerçek hastalık işaretleri yerine tek bir hastaneye, kameraya veya hastalık türüne bağlı kestirmeleri öğrenme riskini azalttılar.

İki beynin birlikte çalışmasına izin vermek

Derin öğrenme modelleri olarak adlandırılan modern görüntü okuma programları örüntüleri tespit etmede çok iyidir ancak her birinin kendi güçlü ve zayıf yönleri vardır. Tek bir modele güvenmek yerine ekip, iki tanınmış görüntü ağını paralel çalıştırıp gördüklerini harmanlayan “çift‑omurga” sistemleri kurdu. Bu ağlardan biri, EfficientNetB0, görüntülerde genel yapıyı yakalayan kompakt ve verimli bir model olup her zaman temel olarak kullanıldı. Sırasıyla ResNet50, InceptionV3 ve AlexNet ile eşleştirildi; bunlar daha derin, çok ölçekli veya hafif örüntü tanımada uzmanlaşmış modellerdir. Sistemler daha sonra iki özellik kümesini çeşitli şekillerde birleştirdi: basitçe birleştirerek, toplayarak, farklı ağırlıklar vererek veya her modelin nihai cevabı oylamasına izin vererek.

Sistemi teste sokmak

Araştırmacılar, retina görüntülerinin çoğu üzerinde 12 farklı model kombinasyonunu eğitti ve ayarladı, performansı kontrol etmek için bazılarını ayırdı. İç testte en iyi yaklaşım EfficientNetB0 ile ResNet50’den gelen özellikleri birleştirmek oldu; bu yöntem yaklaşık %95 genel doğruluk ve tanısal kaliteyi ölçen standart bir ölçekte neredeyse kusursuz bir skor elde etti. InceptionV3 ve AlexNet ile yapılan benzer kombinasyonlar da güçlü performans gösterdi. Sistemin yalnızca eğitim setini ezberlemek yerine gerçek dünyadaki çeşitliliği kaldırıp kaldıramayacağını görmek için ekip, tüm modelleri farklı hastanelerde farklı kameralarla çekilmiş iki bağımsız koleksiyondan 400 görüntü üzerinde test etti. Burada doğruluk daha da yükseldi, yaklaşık %95 ile %98 arasında değişti ve tüm modeller hastalıklı gözleri sağlıklılardan ayırma konusunda çok yüksek puanlarını korudu.

Siyah kutunun içine bakmak

Doktorlar ve düzenleyiciler giderek yalnızca “Ne kadar doğru?” değil, ayrıca “Neden bu kararı veriyor?” sorusunu da soruyor. Buna yanıt vermek için yazarlar Score‑CAM ve LIME gibi görselleştirme araçlarını kullandı. Bu araçlar, bir görüntünün modelin kararını en çok etkileyen bölgelerini vurgulayarak sistemin “dikkatini” retinaya bindirilmiş ısı haritalarına dönüştürdü. Diyabetik retinopati için vurgulanan bölgeler, sızıntı yapan kan damarları ve keskin görüş merkezi olan makula yakınındaki lekelerle örtüştü. Glokomda odak noktası, hasarın oluştuğu optik sinir başı ve çevresindeki dokuya yöneliyordu. Katarakta ilişkin kararlar görsel yol boyunca yaygın bulutlanmayı vurguladı. Kritik olarak, normal gözlerde güçlü ve yanlış yerlere düşmüş sıcak noktalar görülmedi. Modelin odağı ile ders kitaplarındaki anatomi arasındaki bu yakın uyum, sistemin klinisyenlerin uygulamada kullandığı aynı özelliklere odaklandığını düşündürüyor.

Günlük bakım için bunun anlamı ne olabilir

Bir uzman olmayan için sonuç şu: standart bir kamera ile çekilmiş tek bir retina fotoğrafı yakında aynı anda birden fazla büyük körlük nedenini taramaya yardımcı olabilir. Çift ağ tasarımı ve çıktıları harmanlamanın akıllı yolları yalnızca yüksek doğruluk sağlamakla kalmadı, aynı zamanda görüntüler yeni kliniklerden ve cihazlardan geldiğinde bile istikrarlı sonuçlar verdi—bu gerçek dünya kullanımı için zorunlu bir özellik. Teknolojinin kendi başına tedavi yönlendirebilmesi öncesinde daha büyük ve daha çeşitli popülasyonlarda daha fazla teste ihtiyaç olsa da, bu çalışma farklı türde yapay “gözlerin” birleştirilmesinin hızlı, güvenilir ikinci görüşler üretebileceğini gösteriyor. Yoğun hastanelerde, küçük kliniklerde veya mobil tarama birimlerinde bu tür araçlar, acilen bir göz hekimine gitmesi gereken kişileri işaretleyerek milyonlarca insanın görmesini korumaya yardımcı olabilir.

Atıf: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0

Anahtar kelimeler: göz hastalığı, retina görüntüleme, derin öğrenme, glokom, diyabetik retinopati