Clear Sky Science · tr
Makine öğrenimi modellerinin çıktı skorlarından olasılık oranını tahmin etmek: olanaklar ve sınırlamalar
Sağlık ve yapay zekâ açısından neden önemli
Doktorlar ve halk sağlığı araştırmacıları, sıcaklık veya hava kirliliği gibi çevresel faktörlerin sağlığımızı nasıl etkilediğini keşfetmek için giderek daha fazla yapay zekâya yöneliyor. Ancak modern makine öğrenimi araçları kimi kişilerin hasta olma olasılığını tahmin etmede güçlü olsa da, klinisyenleri ve politika yapıcıları ilgilendiren daha temel bir soruyu sıklıkla yanıtlayamıyorlar: belirli bir maruziyet riski ne kadar artırıyor ya da azaltıyor? Bu çalışma, popüler makine öğrenimi modellerinin opak çıktılarını tıp ve epidemiyolojide karar vermeyi temel alan tanıdık olasılık oranlarına nasıl çevireceğimizi göstererek bu boşluğu ele alıyor.

Siyah kutu skorlarından anlaşılır risklere
Geleneksel epidemiyolojide, lojistik regresyon adı verilen yaygın bir yöntem, bir maruziyet (örneğin soğuk hava) ile bir sağlık çıktısı (örneğin hastaneye yatış) arasındaki ilişkiyi, yaş veya kirlilik gibi diğer faktörleri kontrol ederek kurar. Bunun başlıca gücü yorumlanabilirliktir: doğrudan bir olasılık oranı sağlar; bu, bir gruptaki hastalanma olasılığının diğerine göre kaç kat daha yüksek (veya düşük) olduğunu söyler. Rastgele ormanlar ve gradyan artırma gibi modern makine öğrenimi yöntemleri veride çok daha karmaşık desenleri yakalayabilir, ancak genellikle riske doğrudan anlam veren skorlar döndürmezler; bu da sonuçları klinisyenlerin güvendiği bir dilde rapor etmeyi zorlaştırır. Yazarlar bu iki dünyayı birbirine bağlamayı hedeflediler.
Makine öğrenimi modellerinden riski okumanın yeni yolları
Araştırmacılar, makine öğrenimi sınıflandırıcılarının ürettiği skorlardan olasılık oranlarını geri kazanmak için on farklı yöntem önerdiler. Bu “hibrit” kestirimcilerden sekizi, modelin ham veya kalibre edilmiş skorlarından—her kişi için çıktının olası olduğunu yansıtan sıfır ile bir arasında sayılar—başlayıp bu skorların basit bir özetini geleneksel bir lojistik regresyon modelinden türetilen bir düzeltme faktörü ile çarpar. Bu faktör, maruziyetli ve maruziyetsiz gruplar arasındaki yaş, mevsim ve diğer arka plan değişkenlerindeki farkları hesaba katar. İki ek kestirimci ise kısmi bağımlılık fonksiyonlarına dayanır; bu araç pratikte “herkesin maruziyet düzeyi A olsaydı mi yoksa B olsaydı mı model ne tahmin ederdi, diğer her şey gözlemlendiği gibi bırakılırsa?” sorusunu sorar. Bu tahminleri karşılaştırarak, yazarlar makine öğrenimi modelinin veri üzerindeki görüşünü yansıtan model tabanlı bir olasılık oranı elde ederler.
Yöntemleri gerçek sağlık sorularında test etmek
Bu fikirlerin ne kadar iyi çalıştığını görmek için ekip, İsrail’den iki büyük epidemiyolojik veri kümesi üzerinde lojistik regresyon, rastgele orman ve gradyan artırma olmak üzere üç modele uyguladı. Bir veri kümesi, solunum veya kardiyovasküler sorunlarla hastaneye kabul edilen yaşlı yetişkinleri izleyerek olağandışı düşük sıcaklıkların yatış olasılığını artırıp artırmadığına odaklandı. Diğeri ise doğum öncesi daha yüksek sıcaklıkların iki yaşında fazla kiloyla ilişkili olup olmadığını incelemek için 160.000’den fazla bebeği takip etti. Veri kümesi ve modelin her kombinasyonu için onlarca olasılık oranı tahmini ve belirsizlik aralıkları hesaplandı ve pratik bir karşılaştırma olarak standart lojistik regresyonun sonuçlarıyla kıyaslandı.

Hangi makine öğrenimi araçları en iyi davrandı
Çalışmadaki önemli bir adım, makine öğrenimi modellerinin ham skorlarını yeniden şekillendiren “kalibrasyon”du—örneğin yüzde 20 risk atanan kişiler arasında yaklaşık beşte birinin gerçekten sonuçla karşılaşması gibi. Yazarlar üç yaygın kalibrasyon yöntemini test ettiler ve izotonik regresyon adı verilen basit bir tekniğin genellikle rastgele orman ve gradyan artırma skorlarını iyi davranan olasılık değerlerine en çok yaklaştırdığını buldular. Bu kalibre edilmiş skorlar olasılık oranı kestirimcilerine beslendiğinde önemli bir desen ortaya çıktı: gradyan artırmadan türetilen olasılık oranları genellikle lojistik regresyondan elde edilenlerle iyi uyum gösteriyordu; tahminlerin yaklaşık %87’si lojistik modelin %95 güven aralığı içinde yer aldı ve çoğu zaman daha dar belirsizlik aralıkları üretti. Buna karşılık, rastgele ormanlar düzensiz davranışlar sergiledi—birçok tahmin 0 veya 1’e çöktü; bu da birkaç olasılık oranı tahminini kalibrasyondan sonra bile istikrarsız veya yanıltıcı hale getirdi.
Halk sağlığında yapay zekâ kullanımı için çıkarımlar
Çalışma, çevresel sağlık araştırmalarında sık görülen koşullar altında, modern makine öğrenimi modellerinin öngörü gücünden ödün vermeden yorumlanabilirlik elde etmenin mümkün olduğunu gösteriyor. Dikkatli kalibrasyon ve önerilen kestirimcilerle eşleştirildiğinde, gradyan artırma modelleri klasik lojistik regresyona kıyaslanabilir ve bazen onlardan daha hassas olabilecek olasılık oranları sağlayabilir. Ancak tüm makine öğrenimi algoritmaları bu görev için eşit derecede uygun değil: özellikle rastgele ormanlar etkı büyüklüğünü tahmin etmek için ek dikkat veya alternatif stratejiler gerektirebilir. Politika yapıcılar ve klinisyenler için ana mesaj, gelişmiş yapay zekâ yöntemlerinin siyah kutu olarak kalmak zorunda olmadığıdır—düşünceli kullanıldığında, gerçek dünya kararlarını destekleyecek açık ve tanıdık risk ölçüleri sağlayabilirler.
Atıf: Nirel, R., Bauman, N., Morin, E. et al. Estimating the odds ratio from the output scores of machine learning models: possibilities and limitations. Sci Rep 16, 8922 (2026). https://doi.org/10.1038/s41598-026-38150-1
Anahtar kelimeler: olasılık oranı, makine öğrenimi, epidemiyoloji, risk tahmini, sıcaklık ve sağlık