Clear Sky Science · tr

Birleşik retina görüntü analizinde kapılı görev-dikkatli çok görevli ağ

· Dizine geri dön

Diyabetli kişiler için göz taramalarının önemi

Diyabet, gözün arkasına sessizce zarar vererek önlenebilir körlüğün önemli bir nedeni olan diyabetik retinopatiye yol açabilir. Retina fotoğraflarının düzenli çekilmesi bu hasarı erken yakalayabilir, ancak her görüntüyü elle inceleyecek yeterli uzman yok. Bu makale, hem önemli bir göz yapısını çizebilen hem de hastalığın ne kadar ilerlediğini değerlendirebilen tek bir akıllı sistem sunarak yaygın taramaları daha hızlı, tutarlı ve uygulanması kolay hale getirmeyi amaçlıyor.

Birçok ayrı araç yerine tek bir sistem

Günümüzde retina görüntülerini okuyan bilgisayar araçları genellikle tek bir işe odaklanır; örneğin hastalık şiddetini derecelendirmek veya sinirlerin gözü terk ettiği parlak dairesel bölge olan optik diskin sınırını izlemek gibi. Birden çok ayrı aracı çalıştırmak yavaştır ve görüntüdeki paylaşılan ipuçlarını boşa harcar, oysa optik diskin şekli ve konumu diyabetik hasarın ortaya çıktığı yerlere yakından bağlıdır. Yazarlar, tek bir retina fotoğrafını alıp iki görevi aynı anda yapan GTAM Net adlı birleşik bir model öneriyor: optik diskin hassas bir maskesini çizer ve gözü hastalıksız formdan en şiddetli forma kadar beş diyabetik retinopati evresinden birine atar.

Figure 1. Tek bir yapay zeka sistemi, tek adımda hem temel bir göz yapısını izler hem de diyabetik hasarı değerlendirir.
Figure 1. Tek bir yapay zeka sistemi, tek adımda hem temel bir göz yapısını izler hem de diyabetik hasarı değerlendirir.

Akıllı göz modelinin öğrendiklerini nasıl paylaştığı

GTAM Net’in merkezinde görevlerin birbirine yardım etmesine izin verirken birbirlerinin yolunu kapmamalarını sağlama fikri vardır. Sistem önce retina görüntüsünü, ince damar detaylarından daha geniş desenlere kadar çeşitli ölçeklerde şekil, renk ve doku yakalayan bir dizi özellik haritasına dönüştürür. Özel bir kapı birimi, her katman için bu bilgilerin hangi kısımlarının paylaşılacağı ve hangi kısımlarının optik diski çizmek veya hastalığı derecelendirmek için özel tutulacağına karar verir. Paralel olarak, başka bir dikkat birimi iki görev dalının birbirinden yararlı ipuçları ödünç almasına izin verir; böylece hastalık ipuçları disk sınırını keskinleştirebilir ve disk ile diğer yapı bilgileri hastalık derecelendirmesini netleştirebilir.

Görevleri dengelemek ve birçok veri kümesi üzerinde çalışmak

Böyle bir ortak sistemi eğitmek zordur, çünkü bir görev kolayca öğrenme sürecine hâkim olabilir. Bunu önlemek için yazarlar, modelin eğitim sırasında her görev hakkında ne kadar belirsiz olduğunu tahmin etmesine izin verir ve otomatik olarak her hedefe daha fazla veya daha az ağırlık verir. Ayrıca hem küçük detayları hem de genel düzeni takip eden bir özellik piramidi kullanırlar. GTAM Net, görüntü kalitesi, kamera tipi ve hasta dağılımı bakımından farklı beş büyük açık retinal koleksiyonda test edildi. Optik disk için uzman çizimleri olan veri kümelerinde sistem, önceki disk segmentasyon araçlarıyla denk veya daha iyi olan yaklaşık %98’e yakın dice skoruna ulaştı. Diyabetik retinopati derecelendirmesi için ise birkaç test setinde yaklaşık %98–99 doğruluk bildirdi ve aynı koşullar altında güçlü mevcut yöntemleri geride bıraktı.

Sağlamlık, sınırlamalar ve görüntülerin neyi ortaya koyduğu

Yazarlar ham puanların ötesine geçip sistemin nerede başarılı olduğunu veya başarısız olduğunu inceliyor. Dikkat haritaları, hastalığı derecelendirirken modelin minik kanamalar ve parlak birikintiler gibi şüpheli noktalara odaklandığını, segmentasyon için ise disk kenarına ve yakın damarlarına kilitlendiğini gösteriyor. Görüntüler bulanık, kötü aydınlatılmış veya nadir göz şekilleri ya da çok yoğun kanama içeriyorsa, sınırlar ve derecelendirmeler hâlâ sapabiliyor ve hatalar genellikle uzmanların ayırmakta zorlandığı komşu şiddet seviyeleri arasında oluyor. Modelin bir veri kümesi üzerinde eğitilip başka bir kümede değerlendirildiği çapraz testler, performansta yalnızca ılımlı düşüşler gösteriyor; bu da paylaşılan, kapılı tasarımın tek bir koleksiyonun gariplikleri yerine genel retina desenlerini yakaladığını düşündürüyor.

Figure 2. Model içinde, paylaşılan görüntü özellikleri iki yola kapılarak iletilir; bu yollar birlikte optik disk sınırını ve hastalık evresini rafine eder.
Figure 2. Model içinde, paylaşılan görüntü özellikleri iki yola kapılarak iletilir; bu yollar birlikte optik disk sınırını ve hastalık evresini rafine eder.

Gelecekteki göz taramaları için bunun anlamı

Basitçe söylemek gerekirse, çalışma iyi tasarlanmış bir iki işi bir arada yapan ağın, ana göz yapılarını çizmeye ve diyabetik hasarı derecelendirmeye yönelik ayrı araçlarla eşleşebileceğini veya onları aşabileceğini ve gerçek dünya taramaları için yeterince hızlı kalabileceğini gösteriyor. Görevlerin kontrollü biçimde bilgi paylaşmasına ve eğitim sırasında etkilerinin ayarlanmasına izin vererek GTAM Net, çeşitli görüntü kaynakları arasında doğru ve nispeten istikrarlı performans sunuyor. Yazarlar gerçek klinik ortamların düzenlenmiş test setlerinden daha karmaşık olduğunu ve insan yargısının hâlâ gerekli olduğunu vurgulasa da, sonuçları birleşik, görev farkında modellerin büyük ölçekli, otomatik göz tarama programlarının merkezi yapı taşları haline gelebileceğini öne sürüyor.

Atıf: Sajid, M.Z., Qureshi, I., Hamid, M.F. et al. A gated task-attentive multi-task network for unified retinal image analysis. Sci Rep 16, 16426 (2026). https://doi.org/10.1038/s41598-026-52418-6

Anahtar kelimeler: diyabetik retinopati, retina görüntülemesi, optik disk segmentasyonu, çok görevli öğrenme, tıbbi yapay zeka