Clear Sky Science · tr
Önceden eğitilmiş CNN'ler, LSTM ve koşullu GAN kullanılarak dönüştürülmüş sayısal verilerle geliştirilmiş diyabet tahmini
Neden daha akıllı diyabet kontrolleri önemli
Tip 2 diyabet sıklıkla “sessiz bir hastalık” olarak adlandırılır çünkü semptomlar belirginleşmeden çok önce kalp, böbrekler, gözler ve sinirler üzerinde sessizce hasar oluşturabilir. Hekimler zaten kan şekeri, kan basıncı, kilo ve yaş gibi basit ölçümleri toplayarak bir kişinin riskini değerlendirmeye çalışır. Ancak bu birkaç sayıyı doğru bir erken uyarı sistemine dönüştürmek şaşırtıcı derecede zordur, özellikle mevcut veri sınırlıysa. Bu çalışma, bilgisayarların kimlerin diyabet geliştirme olasılığının en yüksek olduğunu tespit edebilmesi için küçük, rutin veri kümelerinden daha fazla bilgi çıkaracak yaratıcı bir yaklaşımı araştırıyor; bu sayede daha erken bakım ve daha az komplikasyon mümkün olabilir.
Sayılardan görüntüye dönüştürme
Çoğu tıbbi kayıt tablo halinde saklanan sayılar olarak bulunur. Oysa modern görüntü tabanlı derin öğrenme sistemleri en iyi şekilde görseller üzerinde çalışır. Araştırmacılar bu farkı, iyi bilinen bir diyabet veri setindeki her bir kişinin sekiz rutin ölçümünü küçük yapay bir görüntüye çevirerek kapatıyor. Birlikte değişme eğiliminde olan özellikler —örneğin kan şekeri ve vücut kitle indeksi— görsel içinde yakın yerleştirilir ve daha önemli özelliklere daha büyük alanlar ayrılır. Aslında her hastanın sağlık profili, görüntü tanıma ağlarının okuyabileceği basit bir yama resmine dönüşür. Bu tür “tablodan-görüntüye” dönüşüm, ekipin nesne tanıma ve tıbbi görüntüleme gibi görevler için geliştirilen güçlü araçları yeniden kullanmasına olanak tanır.

Çok az veriden makineleri eğitmek
Diyabet tahmininde büyük bir engel, açık veri setlerinin boyutlarının sınırlı ve genellikle dengesiz olması; diyabetli grupta daha az kişinin bulunmasıdır. Böyle küçük, eğimli örneklemler üzerinde büyük sinir ağları eğitmek, kağıt üzerinde iyi görünen ancak yeni hastalarda başarısız olan modellerle sonuçlanabilir. Bunu dengelemek için yazarlar önce veriyi her iki sonucun eşit temsil edildiği şekilde yeniden dengeliyor. Ardından koşullu bir GAN gibi bir üretici model türü kullanarak her gruptan gerçek hastalara benzeyen çok sayıda ek sentetik görüntü oluşturuyorlar. Bu yapay örnekler, eğitim havuzunu 1.000'den 9.000 görüntüye genişletirken genel istatistiksel yapıyı koruyor ve öğrenme algoritmalarına çalışmaları için çok daha fazla çeşitlilik sağlıyor.
Desenleri ve bağlamı okuyan katmanlı ağlar
Sayılarla tutulan kayıtlar görüntülere dönüştürüldükten ve sentetik örneklerle çoğaltıldıktan sonra, bu resimler başta genel amaçlı büyük görüntü koleksiyonlarında eğitilmiş birkaç gelişmiş görüntü tanıma ağından geçirilir. DenseNet, ResNet, Xception ve EfficientNet gibi önceden eğitilmiş modeller, her görüntüden yüzlerce ince görsel deseni çıkaran oldukça deneyimli özellik algılayıcıları gibi davranır. Karar doğrudan verilmek yerine, bu modellerin çıktıları sıralı diziler olarak ele alınır ve dizilerdeki bağımlılıkları bulmada iyi olan bir ağ türü olan LSTM'ye verilir. Bu iki aşamayı üst üste koyarak sistem hem yerel desenleri (ilişkili ölçümlerin nasıl kümelendiği) hem de daha geniş ilişkileri (ölçüm gruplarının birlikte riski nasıl işaretlediği) yakalayabilir ve ardından kişinin diyabet olma olasılığını karara bağlar.

Sistem ne kadar iyi çalışıyor?
Klasik Pima Indians Diabetes Dataset'in artırılmış versiyonu üzerinde değerlendirildiğinde, en iyi performans gösteren konfigürasyon —ResNet tabanlı bir özellik çıkarıcı ile bir LSTM'nin ve dört görüntü modelinden elde edilen özelliklerin füzyonunun birleşimi— vakaların yaklaşık %94'ünü doğru sınıflandırdı ve iki grubu ayırmadaki başarının yaygın bir ölçüsü olan eğri altındaki alan (AUC) puanı %98 elde etti. Bu sayılar, ham sayı tablosu üzerinde doğrudan çalışan geleneksel makine öğrenmesi yöntemlerine dayanan birçok önceki bildirime kıyasla daha yüksek. Yaklaşımın tek bir çalışma popülasyonunun ötesine genellenip genellenemeyeceğini değerlendirmek için yazarlar ayrıca bir Alman hastanesinden bağımsız bir veri seti üzerinde de test etti. Orada, iki hasta grubunun yaş, cinsiyet ve arka plan farklılıklarına rağmen sistem benzer doğruluk ve ayırt edicilik gösterdi.
Gerçek dünya kullanımı için umut ve ihtiyat
Uzman olmayanlar için ana çıkarım, tanıdık, düşük maliyetli klinik ölçümlerin bunları basit görüntüler olarak yeniden düşünerek ve olgun görüntü analiz araçlarını işe koyarak daha bilgilendirici hale getirilebileceğidir. Çalışma, gerçekçi sentetik veriler ve katmanlı sinir ağları ile birleştirildiğinde bu stratejinin diyabet için ve yapılandırılmış kayıtlara dayanan diğer hastalıklar için bilgisayarlı taramayı keskinleştirebileceğini öne sürüyor. Aynı zamanda yazarlar önemli uyarılara dikkat çekiyor: güçlü performansın bir kısmı sentetik verilerden kaynaklanıyor olabilir ve her iki veri seti de boyut ve demografi açısından sınırlı. Böyle bir sistem kliniklerde bakım yönlendirmeden önce çok daha büyük ve çeşitli hasta grupları üzerinde test edilmeli ve klinisyenlerin güvenebileceği açıklamalarla eşleştirilmelidir. Yine de bu çalışma, küçük, rutin veri kümelerinin bile kronik hastalıklar için daha güvenilir erken uyarılar destekleyebileceği bir geleceğe işaret ediyor.
Atıf: Singh, K.R., Dash, S., Liu, H. et al. Enhanced diabetes prediction using pre-trained CNNs, LSTM, and conditional GAN on transformed numerical data. Sci Rep 16, 8081 (2026). https://doi.org/10.1038/s41598-026-38942-5
Anahtar kelimeler: tip 2 diyabet, tıbbi yapay zeka, derin öğrenme, risk tahmini, sentetik veri