Clear Sky Science · tr
Göğüs röntgeni yorumlaması için sınıf-dikkati havuzlama ve token seyrekliğine dayalı görsel transformerlar
Küresel bir akciğer hastalığı için daha akıllı röntgenler
Verem, dünyanın en ölümcül bulaşıcı hastalıklarından biri olmaya devam ediyor ve göğüs röntgenleri, özellikle düşük ve orta gelirli ülkelerde kalabalık kliniklerde sıklıkla ilk ve tek görüntüleme testi olarak kullanılıyor. Ancak bu görüntüleri okumak zor ve zaman alıcı; uzmanlar için bile. Bu çalışma, göğüs röntgenlerindeki verem belirtilerini çok yüksek doğrulukla saptamanın yanında, kararını etkileyen akciğer bölgelerini doktorlara tam olarak göstererek güven oluşturmaya ve daha hızlı, tutarlı tanılara destek vermeye yönelik bir yapay zeka sistemi sunuyor.
Göğüs görüntülerini okumanın zorluğu
Göğüs röntgenleri ucuz, hızlı ve geniş ölçüde erişilebilirdir; bu da onları kitlesel tarama için cazip kılar. Sorun şu ki, verem ince yollarla ortaya çıkabilir ve gürültülü, az- veya çok pozlanmış ya da eski ekipmanla çekilmiş görüntülerde kolayca kaçabilir. İnsan okuyucular arasında fikir ayrılıkları olabilir ve yoğun klinikler radyologları zorlayabilir. Geleneksel bilgisayar programları görüntülerde el yapımı özellikler ölçüp bunları standart makine öğrenimi modellerine vermek suretiyle bu sorunu çözmeye çalıştı; ancak bu erken sistemler, görüntüler yeni hastanelerden geldiğinde veya teknik ayarlar farklı olduğunda zorlanıyordu.
Sinir ağlarından dikkat odaklı görsele
Derin öğrenme, özellikle evrişimli sinir ağları, piksellerden doğrudan örüntüler öğrenerek veremi tespit etmede ilerleme sağladı. Ancak bu ağlar ağırlıklı olarak görüntüdeki yerel komşuluklara odaklanır ve her iki akciğeri kapsayan daha geniş desenleri kaçırabilir. Görsel transformer adı verilen daha yeni modeller, bir röntgeni küçük yamalar ızgarası olarak görür ve her yamanın diğerleriyle nasıl ilişkili olduğunu öğrenerek uzun menzilli yapıları yakalar. Güçlü olmalarına karşın, hazır transformerlar önemsiz bölgelere dikkat verebilir ve yorumlanmaları zor olabilir; bu durum kararların klinik muhakemeyle örtüşüp örtüşmediğine dair endişeler doğurur.

Akciğer taramaları için özel bir yapay zeka hattı
Yazarlar, göğüs röntgenleri için bu zayıflıkları ele alacak şekilde özelleştirilmiş bir görsel transformer tasarlıyor. Önce her görüntü dikkatle ön işleme tabi tutulur: yeniden boyutlandırılır, normalleştirilir ve genellikle soluk akciğer lezyonlarının öne çıkmasını sağlayan ancak aşırı keskinleştirmeden kaçınan bir kontrast iyileştirme tekniğinden geçirilir. Modelin önünde hafif bir evrişimsel aşama, tıbbi görüntülerde önemli olan kenarlar ve dokular gibi ince ayrıntıları çıkarır. Görüntü daha sonra küçük yamalara bölünür; her yama transformer’ın işleyebileceği bir tokena dönüştürülür.
Modele nerelere bakacağını öğretmek
Sistemin anatomi takibini sürdürmesine yardımcı olmak için model, her yamanın akciğer içindeki konumuna dair bilgi enjekte eden bir pozisyon kodlama mekanizması kullanır; tüm konumları eşdeğermiş gibi işlememek için. Ayrıca her hastalık kategorisi için birer tane olmak üzere özel "sınıf" tokenları tanıtır; bu tokenlar tüm yamalardan en ilgili delilleri toplamayı öğrenir. Bir seyrelme (sparsity) stratejisi, ağın yalnızca en bilgi verici tokenların bir alt kümesine dayanmasını teşvik ederek arka plan desenlerini ve gürültüyü eler. Eğitim reçetesinde tokenların rastgele düşürülmesi, dikkatle seçilmiş öğrenme hızı çizelgelemesi ve karışık hassasiyet hesaplaması gibi teknikler yer alır; bunların hepsi sınırlı tıbbi veride öğrenmeyi stabilize etmek ve eğitim görüntülerinin tuhaflıklarına fazla uymaktan kaçınmak için seçilmiştir.

Yapay zekanın ne gördüğünü görmek
En önemlisi, sistem kendi kendini açıklayacak şekilde inşa edilmiştir. "Verem" veya "normal" tahmini yaptıktan sonra model, Grad‑CAM olarak bilinen bir yöntem kullanarak ısı haritaları üretir. Bu renkli örtüşmeler, kararı en çok etkileyen akciğer bölgelerini vurgular. Yazarlar, açıklama hattını hastalıklı ve sağlıklı vakalardan dengeli örnekler gösterecek biçimde tasarlar; böylece radyologlar aracın klinik olarak anlamlı yapılara mı yoksa alakasız artefaktlara mı baktığını doğrulayabilir. İki açık verem veri kümesinde yaklaşım doğrulama doğruluğuna yakın %98 ve mükemmele yakın ayırt edicilik için eğri altı alana ulaşmış olsa da, yazarlar görüntü düzeyindeki veri bölüşümünün gerçek dünya performansını biraz abartmış olabileceği ve dış testlerin hâlâ gerektiği konusunda ihtiyatlıdır.
Gelecekte bakım için ne anlama geliyor
Sade ifadeyle, bu çalışma göğüs röntgenlerinde muhtemel verem vakalarını hızla ve doğru biçimde işaretleyebilen, aynı zamanda muhakemesinin net bir görsel "haritasını" çizebilen bir yapay zeka sistemini gösteriyor. Böyle bir araç, kaynakları kısıtlı kliniklerde hastaları triage etmeye, atlanan vakaları azaltmaya ve radyologlar için tutarlı bir ikinci görüş sağlamaya yardımcı olabilir. Aynı zamanda yazarlar, modellerinin yalnızca iki genel veri kümesinde test edildiğini, tek bir hastalık etiketine odaklandığını ve tam klinik doğrulamadan yoksun olduğunu vurguluyor. Gelecek adımlar arasında yöntemin birden fazla akciğer durumuna genişletilmesi, CT gibi 3B taramalara uyarlanması, açıklamaların radyologlarla doğrulanması ve hastaneler arası testler yer alıyor. Yine de çalışma, sadece doğru olmakla kalmayıp aynı zamanda veremle mücadelede şeffaf ve güvenilir olması hedeflenen yapay zekaya yönelik ümit verici bir adımı işaret ediyor.
Atıf: Lokunde, V., Sundar, K., Khokhar, A. et al. Class-attention pooling and token sparsity based vision transformers for chest X-ray interpretation. Sci Rep 16, 8035 (2026). https://doi.org/10.1038/s41598-026-37109-6
Anahtar kelimeler: verem, göğüs röntgeni, görsel transformer, açıklanabilir yapay zeka, tıbbi görüntüleme