Clear Sky Science · tr

Swarm optimizasyonu ve rastgele orman sınıflandırıcıları kullanarak özellik azaltma ile erken diyabet risk tahmini

· Dizine geri dön

Diyabetin erken yakalanmasının önemi

Tip 2 diyabet genellikle sessizce ilerler ve teşhis konulmadan çok önce kalp, göz, böbrekler ve sinirlere zarar verebilir. Hekimler genellikle bir kişinin riskini değerlendirmek için birçok soru ve teste dayanır; bu da hem hastalar hem de klinikler için zaman alıcı olabilir. Bu çalışma, akıllı bilgisayar programlarının yalnızca birkaç basit evet‑hayır sorusuyla erken diyabet riskini tespit edebilmesini araştırıyor; bu da yoğun veya kaynakları kısıtlı ortamlarda taramayı daha hızlı, daha ucuz ve daha kolay uygulanabilir hale getirebilir.

Figure 1
Figure 1.

Diyabet riski için daha akıllı bir kontrol listesi

Araştırmacılar Bangladeş’in Sylhet kentindeki bir diyabet hastanesinden elde edilen gerçek dünya veri setiyle çalıştı. Veri setindeki 520 kişinin her biri erken evre diyabetli veya değil olarak etiketlendi. Her kişi için hekimler yaş ve sık idrara çıkma (poliüri), aşırı susuzluk (polidipsi), ani kilo kaybı, kaşıntı, bulanık görme ve obezite gibi 15 basit klinik belirtiyi kaydetmişti. Bu girişlerin çoğu anket şeklinde basit evet‑hayır yanıtlarıydı; bu nedenle veriler bir hemşirenin veya sağlık görevlisinin rutin bir ziyarette dakikalar içinde toplayabileceği bilgiye benziyordu.

Bilgisayarı en önemli olana odaklanmaya öğretmek

Takım, tüm 16 bilgiyi varsayılan olarak bir modele beslemek yerine şu temel soruyu sordu: bu özelliklerin hangileri gerçekten diyabet riski hakkında en fazla bilgiyi taşıyor? Bunu yanıtlamak için popüler bir makine öğrenimi yöntemi olan rastgele ormanı, hayvan davranışlarından ilham alan üç "swarm" arama stratejisiyle birleştirdiler: bir tilki optimizatörü, bir balıkgiller (honey badger) algoritması ve ton balığı sürüsü optimizasyonu. Bu sürüler dijital avcılar gibi davranarak, en iyi tahminleri en az girdiyle veren özellik ve model ayarı kombinasyonlarını bulmak için birçok olası kombinasyonda dolaştı. Sistem veriyi defalarca eğitim ve test bölümlerine ayırdı, iç ayarlarını ince ayarladı ve hangi özelliklerin ile parametre değerlerinin birçok çalışmada en iyi sonucu verdiği konusunda oy kullandı.

Sadeleştirilmiş modellerin performansı nasıl oldu

Ortaya çıkan üç model—FOX_RF, HBA_RF ve TSO_RF—hepsi yüksek doğruluk gösterdi. Tüm veri seti üzerinde bir kez eğitilip test edildiğinde, ton balığı temelli model (TSO_RF) herkesin sınıflandırmasını doğru yaparak %100 doğruluk, kesinlik ve geri çağırma elde etti. Yazarlar daha zorlu bir 10 katlı çapraz doğrulama kullandıklarında, ki bu görülmemiş veriler üzerinde test etmeyi taklit eder, TSO_RF hâlâ ortalama doğrulukta %98’in üzerinde performans gösterdi; bu diğer iki modelden ve aynı veri seti üzerinde daha önce yayımlanan tekniklerden biraz daha iyiydi. Önemli olarak, balıkgiller tabanlı model yalnızca 16 özelliğin 10’unu kullanırken sağlam performans gösterdi ve diğer modellerin ihtiyaç duyduğu özellik sayısı sadece 13 veya 14 oldu. Bu azalma, hastalar için daha az soru ve gelecekteki herhangi bir uygulama veya cihaz için daha hafif hesaplama anlamına geliyor.

Figure 2
Figure 2.

Siyah kutunun içine bakmak

Modern tahmin sistemleri genellikle iyi çalışır ama yorumlanması zordur. Bunu ele almak için araştırmacılar, her özelliğin birey düzeyinde modele diyabet ya da değil yönünde ne kadar itki verdiğini ölçmek amacıyla SHAP adlı açıklanabilir‑AI yöntemini kullandı. Üç modelin tamamında aynı desen ortaya çıktı: sık idrara çıkma, aşırı susuzluk ve cinsiyet tahminler üzerinde tutarlı şekilde en güçlü etkiye sahipti; ani kilo kaybı, kas sertliği, sinirlilik ve birkaç diğer belirti destekleyici roller oynuyordu. Takım ayrıca modellerin yanlış sınıflandırdığı spesifik hataları inceledi ve bu ana semptomlardaki küçük değişikliklerin kararları sıklıkla tersine çevirdiğini göstererek modellerin en hassas olduğu noktaları ve kliniklerin dikkatli olması gereken alanları ortaya koydu.

Günlük sağlık hizmetleri için anlamı

Açık bir ifadeyle, çalışma dikkatle tasarlanmış bir bilgisayar modelinin kısa, semptom temelli bir kontrol listesi ve birkaç demografik bilgi kullanarak erken diyabet riskini çok doğru şekilde belirleyebileceğini gösteriyor. Daha az yararlı soruları eleyip en belirgin işaretleri—özellikle sık idrara çıkma, aşırı susuzluk ve cinsiyeti—öne çıkararak bu yaklaşım kliniklerde, toplum sağlığı programlarında veya hatta akıllı telefon tabanlı sistemlerde hızlı tarama araçlarının temelini oluşturabilir. Çalışmanın daha geniş ve çeşitli popülasyonlarda test edilmesi gerektiği halde, bu bulgular erken diyabet uyarılarının hem daha hassas hem de hastalar için daha az yük getirir hale geleceğine işaret ediyor.

Atıf: Sarker, P., Nahid, AA., Choi, K. et al. Feature reduction using swarm optimization and random forest classifiers for early diabetes risk prediction. Sci Rep 16, 14355 (2026). https://doi.org/10.1038/s41598-026-35984-7

Anahtar kelimeler: diyabet tahmini, makine öğrenimi, özellik seçimi, swarm optimizasyonu, erken tanı