Clear Sky Science · tr
Hiperparametre ayarı için GWO-WOA algoritması ve özellik seçimi için BPSO kullanan akciğer kanseri sınıflandırması için hibrit LSTM-GRU çerçevesi
Günlük sağlık için bunun önemi
Akciğer kanserini erken bulmak hayat kurtarabilir, ancak birçok kişi ileri görüntülemeye hastalık çok ilerleyene kadar erişmez. Bu çalışma, yaş, sigara kullanımı, semptomlar ve günlük alışkanlıklar gibi basit sorgu temelli kontrollerin modern yapay zekâ ile birleştirilip bir kişinin yüksek riskte olup olmadığını şiddetli hastalık ortaya çıkmadan uzun süre önce tespit edip edemeyeceğini araştırıyor. Ucuz anketleri ve akıllı bilgisayar modellerini en iyi şekilde kullanarak, çalışma hekimlere ve halk sağlığı programlarına dünya çapında destek olabilecek daha hızlı, daha erişilebilir tarama araçlarına işaret ediyor.

Basit soruları işe yarar sinyallere dönüştürmek
Araştırmacılar, Kaggle sitesinden iki açık veri kümesiyle çalıştı; bunlar birlikte 3.300’den fazla kişiyi kapsıyordu. Tıbbi görüntüler yerine her kayıt, klinik formlarda görebileceğiniz 15 öğe içeriyor: yaş, cinsiyet, sigara durumu, sararmış parmaklar, öksürük, nefes darlığı, göğüs ağrısı ve benzeri risk faktörleri ve semptomlar ile akciğer kanserinin varlığını gösteren bir etiket. Gerçek dünya anket verileri düzensiz olduğu için ekip önce eksik girişleri düzeltip, kopyaları kaldırıp ve iki veri kümesi arasındaki yanıt kodlamalarını uyumlayarak veriyi temizledi. Ayrıca tüm özelliklerin benzer ölçeğe gelmesi için değerleri ayarladılar ve daha küçük veri kümesinde kanser vakalarına güçlü bir eğilim olduğundan dengeleme yöntemi kullanarak modelin yalnızca çoğunluk sınıfını tahmin etme eğilimini azaltmaya çalıştılar.
Bilgisayarın en belirleyici soruları seçmesine izin vermek
Bir formdaki her soru hastalığı tespit etmede aynı derecede yararlı değildir ve çok fazla soru kullanmak bir modeli karıştırabilir. Önemli olanlara odaklanmak için yazarlar, İkili Parçacık Sürü Optimizasyonu (Binary Particle Swarm Optimization — BPSO) adı verilen sürü ilhamlı bir arama stratejisi kullandılar. Basitçe söylemek gerekirse, birçok aday “soru seti” paralel olarak test edilir ve en iyi performans gösterenleri kopyalayıp geliştirerek olasılık uzayında hareket eder. Zamanla bu süreç yaklaşık yedi önemli sorudan oluşan kompakt setlere karar verdi ve sigara, sararmış parmaklar, öksürük, göğüs ağrısı, hırıltı, nefes darlığı ve kronik hastalık gibi özellikleri tekrar tekrar öne çıkardı. Bu odaklanmış setler, tüm 15 sorunun kullanılmasına göre doğrulukta birkaç puanlık iyileşme sağlarken nihai modeli daha yorumlanabilir ve çalıştırması daha hızlı hale getirdi.

Yanıtlardaki örüntüleri okumak için daha akıllı bir motor
Anket yanıtlarını evet-hayır kanser tahminine çevirmek için ekip, sıralar için sık kullanılan iki ilişkili derin öğrenme birimini harmanlayan hibrit bir model kurdu: Uzun Kısa Süreli Bellek (LSTM) ve Kapılı Tekrarlayan Birim (GRU). Anket yanıtları konuşma veya video gibi zaman serileri olmasa da semptomlar ve alışkanlıkların grupları kısa diziler olarak ele alınabilecek örüntüler oluşturur. Model, seçilen soruları önce bilgiyi seçici şekilde saklayıp unutabilen LSTM katmanlarından geçiriyor, ardından daha az iç adımla ve daha düşük hesaplama maliyetiyle bu örüntüleri rafine eden GRU katmanlarından geçiriyor. Deneme-yanılma tasarımından kaçınmak için yazarlar öğrenme hızı, gizli birim sayısı, batch boyutu ve dropout gibi kritik ayarları, "gri kurtların" geniş keşif yeteneğini "balinaların" ince ayar yapmasıyla birleştiren doğa ilhamlı ikinci bir arama katmanını kullanarak ayarladılar. Bu birleşik optimize edici, çapraz doğrulama sırasında tutarlı şekilde yüksek doğruluk veren hiperparametre kombinasyonlarını arıyor.
Sistemin performansı nasıldı
Eğitimden sonra hibrit LSTM–GRU modeli, tek başına LSTM ve GRU ağları, konvolüsyonel sinir ağı, geleneksel destek vektör makineleri ve rastgele ormanlar ve gradyan artırma gibi ağaç tabanlı yöntemler dahil olmak üzere birkaç güçlü temel modele karşı test edildi. Daha küçük, 309 kişilik veri kümesinde önerilen sistem ayrılmış test bölümündeki her vakayı doğru sınıflandırarak %100 doğruluk, kesinlik, duyarlılık ve F1 skoru elde etti. Daha büyük, 3.000 kişilik veri kümesinde de neredeyse mükemmele yakın kaldı; doğruluk yaklaşık %99,3 ve diğer ölçütlerde de benzer şekilde yüksek skorlar göstererek tüm rakip derin öğrenme ve klasik modelleri geride bıraktı. Yazarlar ayrıca sürü aramasıyla önce soru seçimi, sonra kurt-ve-balina optimize edici ile hibrit ağın ayarlanması şeklindeki iki aşamalı stratejilerinin, tekrarlı çapraz doğrulama çalışmaları boyunca daha basit düzenlemelere göre daha kararlı sonuçlar verdiğini gösterdiler.
Gelecekteki akciğer taramaları için anlamı
Günlük dilde, bu çalışma dikkatle tasarlanmış bir yapay zekâ sisteminin sıradan anket yanıtlarını okuyup kıyas veri kümelerinde akciğer kanseri olanları ve olmayanları çok yüksek doğrulukla ayırabileceğini gösteriyor. Bu, görüntülemelerin, hekimlerin veya klinik çalışmaların yerini almaz; yazarlar verilerinin sınırlı olduğunu ve doğrudan hastanelerde kullanıma hazır olmadığını vurguluyor. Yine de yaklaşım, akıllı soru seçimi ile ince ayarlı derin öğrenme motorlarını birleştirmenin düşük maliyetli formları güçlü erken uyarı araçlarına dönüştürebileceğini kanıtlıyor. Daha büyük, klinik olarak küratörlü popülasyonlarda ek testler ve modelin neden bir kişiyi yüksek riskli olarak işaretlediğini gösterebilecek daha iyi açıklama yöntemleri ile benzer sistemler bir gün daha ayrıntılı görüntülemeye kimlerin yönlendirileceğine karar vermede, erken tanıyı desteklerken taramayı uygun maliyetli ve invaziv olmayan bir yöntem olarak tutmada yardımcı olabilir.
Atıf: Amrir, M.M.S., Ayid, Y.M., Elshewey, A.M. et al. A hybrid LSTM-GRU framework for lung cancer classification using GWO-WOA algorithm for hyperparameter tuning and BPSO for feature selection. Sci Rep 16, 8600 (2026). https://doi.org/10.1038/s41598-026-39020-6
Anahtar kelimeler: akciğer kanseri taraması, anket verileri, derin öğrenme, özellik seçimi, tıbbi yapay zeka