Clear Sky Science · tr

Yatan hasta gereksinimlerini tahmin etmek için XGBoost ve genetik algoritmaya dayalı açıklanabilir bir algoritma tasarımı

2026-02-23 · Dizine geri dön

Günlük bakım için neden önemli

COVID-19 salgını sırasında hekimler sıklıkla kimin hastane yatağına ihtiyacı olduğunu ve kimin evde güvenle iyileşebileceğini çok hızlı karar vermek zorunda kaldı. Bu makale, bu karara yardımcı olmak üzere tasarlanmış bilgisayar tabanlı bir aracı tanımlıyor. Araç, risk altındaki hastaları saptamada yüksek doğruluk ile hekimlerin güvenip kullanabileceği açık, basit açıklamaları birleştirmeyi amaçlıyor.

Hasta kayıtlarını erken uyarıya dönüştürmek

Araştırmacılar Nisan 2020 ile Mart 2021 arasında İran’daki tek bir hastanede görülen 1.278 yetişkin COVID-19 hastasının tıbbi kayıtlarını inceledi. Her hasta için yaş, oksijen düzeyi, C-reaktif protein ve D-dimer gibi kan testleri, ateş veya nefes darlığı gibi semptomlar ve diyabet ya da yüksek tansiyon gibi mevcut hastalıklar dahil olmak üzere 27 bilgi topladılar. Sadece laboratuvar veya görüntüleme ile sağlam şekilde doğrulanmış COVID-19 vakaları ve nispeten eksiksiz veriye sahip kayıtlar tutuldu. Ekip veri kümesini dikkatle temizledi, bazı eksik değerleri istatistiksel yöntemlerle doldurdu, belirgin hataları çıkardı ve ardından modellerini oluşturmak ve test etmek için veriyi ayrı parçalara böldü.

Güçlü bir tahmin motoru inşa etmek

Sistemin merkezinde XGBoost adı verilen ve karmaşık verilerde desenleri bulmada çok başarılı bir makine öğrenimi yöntemi yer alıyor. Araç, önceki hastalardan hangi ölçümlerin hangi kombinasyonlarının hastaneye yatış gerektirdiğini öğreniyor. Taze veride 100 kez test edildiğinde, yüksek risklileri düşük risklilerden ayırmada eğri altındaki alan (AUC) 0,85 olarak elde edildi; bu, yatış olasılığı yüksek olanları sıralamada güçlü olduğunu gösteriyor. Gerçekten yatış gerektiren hastaların yaklaşık dörtte üçünü tespit etti ve yatış gerektirmeyenlerin yaklaşık onda dokuzuna doğru güvence verdi. Lojistik regresyon, rastgele ormanlar, basit bir sinir ağı ve LightGBM gibi başka ağaç tabanlı yöntemlerle karşılaştırıldığında XGBoost doğruluk ve güvenilirlik açısından en iyi karışımı sundu.

Siyah kutudan doktorlar için net kurallara

Saf istatistiksel modeller bir siyah kutu gibi algılanabilir: bir risk puanı verirler ama insanın anlayacağı bir gerekçe sunmazlar. Bu kutuyu açmak için ekip, modelin davranışını “EĞER bu koşullar varsa, O HALDE yatış muhtemeldir.” biçiminde kısa, kolay okunur kurallara dönüştüren ikinci bir katman ekledi. Önce aynı anda yalnızca birkaç koşul kullanan küçük karar ağaçları seti eğitildi, ardından bu ağaçlardaki her yol aday kural olarak ele alındı. Bir evrimden esinlenen optimizasyon yöntemi olan genetik algoritma, bu kuralları budamak ve iyileştirmek için kullanıldı; hem doğru hem de yeterli sayıda hastaya uygulanabilir kurallar korunup geri kalanı elendi. Son olarak ilgili uzmanlıklardan on hekim kuralları tıbbi açıdan mantıklı ve anlaşılır olanlarla sınadı. Bu süreç 20’si yatışı işaret eden ve 20’si ayaktan güvenli takibi işaret eden toplam 40 son kural üretti.

Modelin risk hakkında öğrendikleri

Araştırmacılar hangi ölçümlerin en önemli olduğunu incelediklerinde küçük bir grup öne çıktı. Düşük oksijen satürasyonu, yüksek C-reaktif protein, ileri yaş, artmış D-dimer, yüksek ferritin ve düşük lenfosit yüzdesi tahminler üzerinde en büyük etkiye sahipti — bu da oksijen düzeyi ile iltihap veya pıhtılaşma belirteçlerinin ön saflardaki deneyimle örtüştüğünü gösteriyor. Diyabet, BT’de belirgin akciğer tutulumları ve nefes darlığı gibi durumlar da rol oynadı ama biraz daha az merkeziydi. Öksürük veya kas ağrısı gibi yaygın semptomlar ise yatış gereksinimi kararında az katkı sağladı. Ekip ayrıca model performansını erkekler ve kadınlar, genç ve yaşlı hastalar ile ciddi kronik hastalığı olan ve olmayanlar arasında kontrol etti. Farklar küçük ve istatistiksel olarak anlamlı değildi; bu da en azından bu veri kümesinde aracın bu gruplar arasında adil davrandığını düşündürüyor.

Gelecekteki salgınlarda nasıl yardımcı olabilir

Uygulamada sistem iki aşamalı çalışır. İlk olarak XGBoost modeli, hastanın temel bilgileri, hayati bulguları ve rutin kan testlerinden bir yatış riski hesaplar. İkinci olarak araç, hastaya uyan uzman onaylı kurallardan birini arar — örneğin belirli bir oksijen düşüklüğü, yüksek iltihap belirteçleri ve yaş kombinasyonu. Modelin tahminiyle uyuşan bir eşleşme bulunursa, araç önerilen kararın gerekçesi olarak o kuralı klinisyene sunar. Yazarlar, bu iki parçalı tasarımın—doğru tahmin artı basit, uzman onaylı kurallar—yapay zekanın gerçek kliniklerde daha kabul edilebilir olmasını sağlayabileceğini savunuyor. Kural üretme süreci modüler olduğu için benzer sistemler, yerel veriler kullanılarak yeni bulaşıcı hastalıklar için hızla yeniden eğitilebilir ve hastanelerin hastaları triyaj etmesine ve sınırlı kaynakları yönetmesine yardımcı olabilir.

Atıf: Abkar, A., Mehrabi, M., Golabpour, A. et al. Designing an explainable algorithm based on XGBoost and genetic algorithm for predicting hospitalization needs of COVID-19 patients. Sci Rep 16, 10210 (2026). https://doi.org/10.1038/s41598-026-40120-6

Anahtar kelimeler: COVID-19 triyajı, yatarak tedavi öngörüsü, açıklanabilir yapay zeka, klinik karar destek, sağlık hizmetlerinde makine öğrenimi