Clear Sky Science · tr

Koroner arter hastalığı tanısı için açıklanabilir yapay zekâ destekli hibrit özellik seçimi yaklaşımı

· Dizine geri dön

Bu, kalbiniz için neden önemli

Koroner arter hastalığı birçok kalp krizinin arkasındaki durumdur, ancak ciddi hasar oluşana kadar sıklıkla gizli kalır. Doktorların birçok testi vardır, ancak birçoğu maliyetli, invaziv veya özellikle düşük ve orta gelirli ülkelerde erişimi zor olabilir. Bu makale, açıklanabilir yapay zekânın rutin tıbbi verileri elekten geçirip riski kimde olduğunu tespit ederken daha az ölçüm kullanarak hangi bulguların gerçekten önemli olduğuna dair doktorlara içgörü sağlayabileceğini inceliyor.

Figure 1
Figure 1.

Fazla bilginin yarattığı sorun

Modern tıp her kalp hastası için onlarca özellik ölçebilir: yaş, kan basıncı, laboratuvar değerleri, semptomlar ve taramalar ile EKG bulguları. Ancak bu ipuçlarının hepsi eşit derecede faydalı değildir. Çok sayıda zayıf veya birbirini yineleyen ölçüm kullanmak bilgisayar modellerini aslında şaşırtabilir, onları yavaşlatabilir ve tahminlerini daha az güvenilir hale getirebilir. Önceki çalışmalar bu listeyi budamak için birçok yöntem denedi, fakat hiçbir tekniğin her zaman en iyi sonucu verdiği görülmedi ve çoğu kara kutu gibiydi; hangi özelliğin neden korunduğu veya atıldığı konusunda az açıklama sunuyorlardı.

Doğru ipuçlarını seçmenin daha akıllı yolu

Yazarlar bu sorunu ele almak için SHOW (SHAP Optimized Wrapper) adını verdikleri iki aşamalı bir yöntem öneriyor. İlk olarak, SHAP olarak bilinen açıklanabilir bir yapay zekâ tekniği kullanılarak her tıbbi özelliğin koroner arter hastalığını tahmin etmeye ne kadar katkı sağladığı tahmin ediliyor. Bunu problemi farklı yollarla ele alan üç güçlü makine öğrenimi modeli için ayrı ayrı yapıyorlar. Ardından bu üç bakışı tek, kararlı bir özellik sıralamasında harmanlayarak tek bir modelin tuhaflıklarına bağlı kalmamış oluyorlar. Bu, en bilgilendirici klinik ipuçlarından en az faydalı olanlara doğru sıralanmış bir liste sağlıyor.

İnce ve doğru tahmin modelleri oluşturmak

İkinci adımda, SHOW bu sıralı listede aşağı doğru ilerleyerek her sınıflandırıcı için bir özellik kümesi kademeli olarak oluşturuyor. En üstteki özellik ile başlayıp bir model eğitiyor, sonra sıradaki bir sonraki özelliği ekliyor. Yeni bir özellik eklemek doğruluğu artırıyorsa o özellik kalıyor; artırmıyorsa eleniyor. Bu, daha fazla iyileşme görülene kadar devam ediyor. Bu süreç boyunca veriler dikkatlice hazırlanıyor: eksik girdiler temizleniyor, nadir hastalık durumları standart bir aşırı örnekleme yöntemiyle dengeleniyor ve sayısal değerler hiçbir tek ölçümün ham aralık nedeniyle hakim olmaması için ölçekleniyor.

Figure 2
Figure 2.

Yöntemi teste sokmak

SHOW’un gerçekten yardımcı olup olmadığını görmek için ekip, boyut, karmaşıklık ve gerçekten hastalığa sahip hasta sayısı bakımından farklı üç iyi bilinen koroner arter hastalığı veri kümesi üzerinde test etti. Basit lojistik regresyondan daha gelişmiş teknikler olan rastgele ormanlar ve XGBoost’a kadar yedi popüler makine öğrenimi modeli denediler. Her veri kümesi için tüm kullanılabilir özelliklerle performansı SHOW tarafından seçilen özelliklerle karşılaştırdılar ve şans faktörlerini önlemek için testleri çoklu çapraz doğrulama düzeninde birçok kez tekrarladılar. Ayrıca yalnızca genel doğruluğu değil, modellerin hasta hastaları kaçırmaktan ne kadar kaçındığını ve sağlıklı ile hastalıklı vakaları ne kadar net ayırdıklarını da izlediler.

Gerçek hasta verilerinde buldukları

Üç veri kümesinin tümünde SHOW, XGBoost modelinin literatürde bildirilen en iyi sonuçlara eşdeğer veya daha iyi performans göstermesini sağlarken çok daha az girdi kullanılmasına izin verdi. Örneğin, 55 klinik özelliğe sahip bir veri kümesinde SHOW listeleri 14’e indirdi fakat yaklaşık %94 doğruluk ve benzer düzeyde yüksek duyarlılık elde etti; bu da hastalığı olan hastaların çoğunun doğru şekilde işaretlendiği anlamına geliyor. Her biri 13 özelliğe sahip iki diğer veri kümesinde ise yöntem yalnızca 5 özellik seçti ve doğruluğu yaklaşık %86–88 civarında tuttu. Pratikte bu, belirli göğüs ağrısı tipleri, kilit laboratuvar sonuçları ve özel görüntüleme bulguları gibi odaklanmış birkaç ölçümün, akıllıca seçildiklerinde tanısal yükün çoğunu taşıyabileceğini gösteriyor.

Daha basit, daha net kalp kontrollerine doğru bakış

Çalışma, açıklanabilir yapay zekânın sadece tahmin yapmakla kalmayıp günlük klinik işaretlerin koroner arter hastalığının tanısında gerçekten hangilerinin önemli olduğunu da netleştirebileceğini gösteriyor. Küçük, yüksek değerli bir ölçüm setini belirleyerek SHOW, hâlâ yüksek güvenilirliğe sahip ama daha ucuz ve daha hızlı tarama araçlarını destekleyebilir ve klinisyenler için daha şeffaf hale getirebilir. Yaklaşım hesaplama açısından yoğun olup çok büyük veri kümeleri için sadeleştirilmesi gerekecek olsa da, doktorların veriye boğulmadan daha erken kalp hastalığını yakalamalarına yardımcı olacak daha akıllı, daha anlaşılabilir yapay zekâ asistanlarına doğru umut verici bir yol sunuyor.

Atıf: Elemam, T., Refaat, H. & Makhlouf, M. An explainable AI-driven hybrid feature selection approach for coronary artery disease diagnosis. Sci Rep 16, 10411 (2026). https://doi.org/10.1038/s41598-026-41712-y

Anahtar kelimeler: koroner arter hastalığı, açıklanabilir yapay zekâ, özellik seçimi, tıbbi tanı, makine öğrenimi