Clear Sky Science · tr
Diz osteoartriti şiddet derecelendirmesi için çift dikkatli geliştirilmiş Swin Transformer ile röntgen görüntülerinden değerlendirme
Neden ağrıyan dizler önemlidir
Diz ağrısı sadece bir rahatsızlık değildir; özellikle yaş ilerledikçe dünya genelinde sakatlığın önde gelen nedenlerinden biridir. Hekimler, bir hastanın diz osteoartritinin hafif ve yönetilebilir mi yoksa ameliyatı gerektirecek kadar şiddetli mi olduğunu belirlemek için büyük ölçüde röntgen görüntülerine güvenir. Ancak bu görüntüleri okumak zaman alır, erken hasarı kaçırabilir ve farklı uzmanlar her zaman aynı görüşte olmayabilir. Bu çalışma, diz röntgenlerini hızlı ve çok doğru şekilde okumayı amaçlayan yeni bir yapay zekâ (YZ) sistemi sunuyor; böylece klinisyenlerin eklem hasarını daha erken yakalamasına ve tedaviyi daha tutarlı yönlendirmesine yardımcı olabilir.
Diz röntgenlerini okumak için daha akıllı bir yol
Osteoartrit, dizdeki pürüzsüz kıkırdağı zamanla aşındırarak ağrı, sertlik ve hareket kısıtlılığına yol açar. Röntgende hekimler, kemikler arasındaki mesafenin daralması ve osteofit adı verilen küçük kemik çıkıntıları gibi ipuçlarına bakar. Bu değişiklikler, 0 (sağlıklı) ile 4 (şiddetli) arasında beş düzeyli Kellgren–Lawrence (KL) derecesiyle özetlenir. Konvolüsyonel sinir ağlarına (CNN) dayanan geleneksel bilgisayar programları bu derecelendirmeyi otomatikleştirmeye yardımcı olmuştur, ancak tüm görüntüye yayılan ince desenleri yakalamakta zorlanırlar ve genellikle yüksek hesaplama gücü ve uzun eğitim süreleri gerektirirler. Bu makalenin yazarları, yalnızca daha doğru değil, aynı zamanda daha hafif ve daha hızlı bir sistem tasarlamayı amaçladılar; böylece yoğun çalışan ve sınırlı kaynaklara sahip klinikler dahil gerçekçi şekilde kullanılabilsin.

Yeni YZ sistemi nasıl çalışıyor
Araştırmacılar Swin‑O‑NETS adında iki fikri birleştiren hibrit bir model geliştirdiler: gelişmiş bir görüntü okuyucu olan Swin Transformer ve hızlı, hafif bir sınıflandırıcı olan Fast Extreme Learning Network. Önce Osteoarthritis Initiative adlı büyük bir halka açık veritabanından alınan röntgen görüntüleri gürültüden arındırılır ve kontrastı iyileştirilir. Görüntüler daha sonra küçük yamalara bölünür ve diz bölgesini segmente eden ve analiz eden U‑şeklinde bir ağa verilir. Bu ağ içinde, modifiye edilmiş bir Swin Transformer, eklem yüzeyindeki ince ayrıntılardan dizi kapsayan daha geniş yapısal desenlere kadar görüntüyü çoklu ölçeklerde inceler.
Doğru ayrıntılara dikkat etmek
Ana yenilik, modelin hangi görüntü özelliklerinin en önemli olduğuna karar vermesine yardımcı olan çok başlıklı kanal öz-dikkati (multi‑headed channel self‑attention) mekanizmasının kullanımıdır. Model, röntgenin tüm kısımlarını eşit saymak yerine, eklem aralığı daralması, kemik kenarları ve erken kemik büyümeleri hakkında bilgi taşıyan kanallara odaklanmayı öğrenirken daha az bilgi içeren arka plan bölgelerini ihmal eder. Birden fazla dikkat "başlığı" veriyi paralel olarak inceler ve bulgularını birleştirir, böylece dizin genel betimlemesini zenginleştirir. Bu rafine edilmiş özellikler, X‑ray'i beş KL derecesinden birine atayan son adımı gerçekleştiren Fast Extreme Learning Network'e beslenir. Bu sınıflandırıcının iç ağırlıklarını birçok yavaş eğitim döngüsüyle değil tek bir matematiksel adımda hesaplayabilmesi sayesinde, sistem karmaşıklığına rağmen verimli kalır.

Sistemi teste sokmak
Swin‑O‑NETS'in performansını görmek için yazarlar, farklı şiddet derecelerini dikkatle dengeleyerek ve aşırı öğrenmeyi önlemek için döndürme ve ölçeklendirme gibi veri artırma yöntemleri kullanarak 2.047 etiketli diz röntgeni üzerinde eğittiler ve test ettiler. Modellerini standart CNN'ler, VGG‑19, ResNet, DenseNet ve birkaç topluluk (ensemble) ile dikkat destekli varyantlar da dahil popüler derin öğrenme mimarileriyle karşılaştırdılar. Sağlıklıdan şiddetliye kadar beş KL derecesinin tamamında Swin‑O‑NETS tutarlı şekilde en yüksek puanları verdi. Yaklaşık %99,5 genel doğruluk elde etti; benzer şekilde yüksek keskinlik (precision), duyarlılık (recall) ve F1 skorlarına ulaştı ve şiddet seviyelerini ayırt etme yeteneğini gösteren ROC eğrisi altındaki alan 0.9838 oldu. Aynı zamanda birçok transformer tabanlı rakipten daha az hesaplama ve eğitim süresi gerektirdi.
Bu hastalar için ne anlama gelebilir
Basitçe söylemek gerekirse, bu çalışma dikkatle tasarlanmış bir YZ sisteminin diz osteoartritini röntgenlerde neredeyse kusursuz şekilde derecelendirebileceğini ve çalıştırılmasının pratik kalabileceğini gösteriyor. İnsan gözünün kaçırabileceği erken eklem değişikliklerini hızlı ve tutarlı bir şekilde tespit ederek, Swin‑O‑NETS yaşam tarzı veya tıbbi müdahalelerin daha erken uygulanmasını destekleyebilir, eklem protezi ihtiyacını erteleyebilir ve hastaneler arasında bakımın standardizasyonuna yardımcı olabilir. Yazarlar, gerçek dünya dağıtımının daha büyük, çok merkezli veri setlerinde ek testler ve gerçek zamanlı kullanım için uygun daha da hafif sürümlerin geliştirilmesini gerektireceğini not ediyor. Yine de sonuçları, bu tür akıllı görüntü okuyucularının yakında radyologların rutin yardımcıları haline gelerek, ağrılı ve zayıf dizleri olan milyonlarca insan için şansları sessizce iyileştirebileceğini öne sürüyor.
Atıf: Sudha, K., Rajiv Kannan, A. Enhanced swin transformer with dual attention for knee osteoarthritis severity grading from X-ray images. Sci Rep 16, 10617 (2026). https://doi.org/10.1038/s41598-026-44174-4
Anahtar kelimeler: diz osteoartriti, röntgen görüntüleme, derin öğrenme, transformer ağları, tıbbi görüntü sınıflandırma