Clear Sky Science · tr

Verimli SqueezeViT: Göğüs röntgeni görüntü sınıflandırması için hafif bir vision transformer çerçevesi

2026-04-09 · Dizine geri dön

Neden daha hızlı göğüs röntgeni okuması önemli

Göğüs röntgenleri, pnömoniden tüberküloza kadar akciğer ve kalp sorunlarını aramak için doktorların en sık kullandığı yöntemlerden biridir. Yoğun hastanelerde veya sınırlı bilgisayar kaynaklarına sahip küçük kliniklerde, bu görüntüleri hızla okumaya yardımcı olabilecek büyük yapay zeka araçlarını çalıştırmak zordur. Bu çalışma, SqueezeViT adı verilen yeni bir kompakt yapay zeka modelini tanıtıyor; bu model, tipik sistemlere kıyasla çok daha az hesaplama gücü kullanarak röntgenlerdeki göğüs hastalıklarını tespit edecek şekilde tasarlanmış ve gerçek dünya bakımında daha uygulanabilir hale getiriyor.

Akıllı görüntü okuyucularını küçültmenin yeni bir yolu

Modern görüntü tanıma araçları genellikle iki fikre dayanır. Konvolüsyonel sinir ağları, görüntünün küçük bölgelerindeki ince detayları yakalamada iyidir; transformer modelleri ise taramanın tamamı üzerinde daha geniş bağlamı görmede daha etkilidir. Ancak standart vision transformerlar ağır ve yavaştır. Yazarlar, transformerların geniş görüşünü korurken her adımda işlenmesi gereken bilgi miktarını “sıkıştırmak” için SqueezeViT’i tasarladı. Amaçları, tanı için önemli olan görüntü parçalarını korurken fazladan hesaplamayı azaltmak; böylece model mütevazı donanımlarda çalışabilsin.

Figure 1. Kompakt yapay zeka, düşük güçlü tıbbi cihazlarda göğüs röntgeni görüntülerini doğru şekilde sınıflandırmaya yardımcı olur.

Kompakt model akciğerleri ve kalbi nasıl görüyor

SqueezeViT, göğüs röntgenlerini verimli şekilde işlemek için iki yapı taşı birleştirir. İlki, Fire bloğu adı verilen ve görüntüden gelen bilgiyi daha küçük bir özellik kümesine sıkıştırıp sonra hastalığa bağlı kenarlar ve dokular gibi örüntüleri vurgulamak üzere tekrar genişleten akıllı bir filtreye benzer. İkincisi, Translution Bloku adını taşıyan ve görüntüyü küçük yamalara bölerek dikkat (attention) uygulayan yapıdır; bu sayede model akciğerin veya kalbin uzak bölgelerindeki sinyalleri ilişkilendirebilir. Birçok önceki tasarıma göre biraz daha büyük yamalar kullanılarak, attention adımının yapması gereken iş azaltılırken göğsün bir bölümündeki değişikliklerin diğer bölümlerle nasıl bağlantılı olduğu hâlâ yakalanır.

Sistemi teste koymak

SqueezeViT’in pratikte ne kadar iyi çalıştığını görmek için araştırmacılar modeli iki büyük halka açık göğüs röntgeni koleksiyonunda değerlendirdiler: NIH ChestX-ray14 veri seti ve CheXpert veri seti. Bu veri kümeleri birlikte kardiyomegali, ödem, pnömoni ve akciğer nodülleri gibi çeşitli durumlar için etiketlenmiş yüz binlerce görüntü içerir. Ekip SqueezeViT’i sıfırdan eğitti ve onu ResNet ve DenseNet gibi ağır modeller ile MobileNet, ShuffleNet, SqueezeNet ve MobileViT gibi daha hafif seçenekler de dahil olmak üzere iyi bilinen derin öğrenme modelleriyle karşılaştırdı. Değerlendirmede, farklı karar eşiklerinde anormal vakaları normal vakalardan öne sıralayan modellere puan veren alıcı işletim karakteristik eğrisi altındaki alan (AUROC) üzerinde yoğunlaşıldı.

Figure 2. Hafif yapay zeka, göğüs röntgenlerindeki akciğer sorunlarını adım adım tespit etmek için görüntü ayrıntılarını sıkıştırır.

Hız, boyut ve doğruluk arasında denge

Sonuçlar, SqueezeViT’in çok daha büyük modellerle benzer doğruluğa ulaştığını ve bazı görevlerde onlardan daha iyi performans gösterdiğini ortaya koyuyor; aynı zamanda model önemli ölçüde daha küçük. Yaklaşık yarım milyon eğitilebilir parametre kullanarak MobileViT’e göre parametre sayısını %40’tan fazla, bazı en büyük temel modellerle karşılaştırıldığında ise %90’dan fazla azaltıyor. Hesaplamaları, bellek kullanımı ve grafik işlemciler ile standart CPU’larda işleme gecikmeleri azaltılmış; bu da tipik donanımlarda görüntüleri yalnızca birkaç milisaniyede analiz etmeyi mümkün kılıyor. Çoklu hastalık senaryolarında SqueezeViT birçok durumda en iyi ağır modellerle eşleşiyor veya onlara yakın performans gösterirken diğer hafif tasarımların açıkça önüne geçiyor. Basit normal-anaomalı ayrımlarında da her iki veri setinde güçlü ve tutarlı puanlar sunuyor.

Günlük bakım için bunun anlamı

Teknik arka planı olmayan okuyucular için ana mesaj şudur: SqueezeViT, hem hesaplama kaynakları konusunda tutumlu hem de hastalık tespitinde dikkatli bir göğüs röntgeni yapay zekası asistanı geliştirmenin mümkün olduğunu gösteriyor. Bu model radyologların veya klinisyenlerin gerekliliğini ortadan kaldırmasa da, kalabalık hastanelerde şüpheli taramaları daha hızlı işaretlemeye yardımcı olabilir ve sınırlı ekipmana sahip kliniklere gelişmiş görüntü analizini ulaştırabilir. Yazarlar gerçek dünyadaki etiketlerin gürültülü olabileceğini ve bazı hastalık kategorilerinin zorluklarını koruduğunu; ancak bu kompakt tasarımın göğüs görüntülemesi için güvenilir, taşınabilir destek araçlarına doğru umut verici bir adım olduğunu ve gelecekte CT veya MR gibi diğer taramalara da uyarlanabileceğini belirtiyorlar.

Atıf: Maurya, A., Lohia, A., Chirag et al. Efficient SqueezeViT: A lightweight vision transformer framework for chest X-ray image classification. Sci Rep 16, 16183 (2026). https://doi.org/10.1038/s41598-026-47918-4

Anahtar kelimeler: göğüs röntgeni yapay zekası, vision transformer, tıbbi görüntü analizi, hafif derin öğrenme, akciğer hastalığı tespiti