Clear Sky Science · tr

Radyoloji Rutininden Gelen Raporlara Dayalı Takip Görüntülemelerinin Otomatik Belirlenmesi için GPT-4o

· Dizine geri dön

Neden Daha Akıllı Takip Tarama Önemli

Bir hasta BT veya MRG taraması yaptırdığında hikâye yalnızca görüntülerle bitmez. Radyologlar ayrıca tümörleri izlemek, şüpheli lezyonları kontrol etmek veya tedavinin işe yaradığını doğrulamak için takip taramalarının gerekip gerekmediğine ve ne zaman yapılacağına karar vermelidir. Bu kararlar hastalığı erken yakalamakla hastaları gereksiz radyasyon, maliyet ve anksiyeye maruz bırakmak arasındaki farkı yaratabilir. Bu çalışma güncel bir soruyu sordu: modern bir yapay zeka sistemi olan GPT-4o, takip kararlarını standartlaştırmaya yardımcı olarak hastaların tutarlı, kılavuz temelli bakım almasını sağlayabilir mi?

Figure 1
Figure 1.

Çelişkili Mesajlar Sorunu

Meslek kuruluşları birçok kanser ve rastlantısal bulgu için ne zaman ve nasıl görüntülemenin tekrarlanacağına dair ayrıntılı öneriler yayınlar. Yine de günlük uygulamada radyologlar sıklıkla takip konusunda fikir ayrılığı yaşar. Bazıları hızlıca tekrar tarama ister; diğerleri daha temkinlidir. Önceki araştırmalar benzer vakalara bakan radyologlar arasında ileri görüntüleme önerme olasılığının neredeyse yedi katına kadar değişebildiğini göstermiştir. Önerilen birçok plan yayımlanmış kılavuzlarla tam uyumlu değildir; bu da bazı hastaların gereğinden fazla tarama görmesine, bazılarının ise zamanında kontrolleri kaçırmasına yol açar. Bu dengesiz tablo, uygulamayı daha tutarlı, kanıta dayalı kararlara doğru nazikçe yönlendirebilecek araçları gerektirir.

Çalışma Nasıl Kuruldu

Araştırmacılar, metin anlama ve üretme amacıyla tasarlanmış büyük bir dil modeli olan GPT-4o’yu iki Alman hastaneden alınan 100 gerçek radyoloji vakası üzerinde test ettiler. Tüm vakalar yetişkin hastaların kanserle ilişkili soruşturmalar için BT veya MRG taraması geçirdiği, baş-boyun, karaciğer, akciğer ve pankreas olmak üzere dört önemli bölgeyi içeriyordu. Her vaka için modele tıbbi öykü, tarama bulguları ve radyoloğun sonuç kısmı dahil olmak üzere tam yazılı rapor verildi. GPT-4o’dan tek bir görev istendi: bu bilgiler ışığında bir sonraki tarama için kesin görüntüleme yöntemi (ör. BT veya MRG) ve zamanlamasını öner. Aynı soru her vaka için bir radyoloji asistanı ve deneyimli bir uzman radyolog tarafından da yanıtlandı.

Kılavuzlara Karşı Kaliteyi Ölçmek

Bu önerileri değerlendirmek için, hangi önerinin kimden geldiğini bilmeyen iki kıdemli radyolog tüm yanıtları kanser ve radyoloji derneklerinin uluslararası ana kılavuzlarıyla karşılaştırdı. Her öneriyi dört açıdan puanladılar: takip gerektiren tüm ilgili bulguların kapsanıp kapsanmadığı, seçilen görüntüleme tekniğinin uygunluğu, önerilen zamanlamanın doğruluğu ve beş puanlık bir ölçekte genel kalite puanı. Uzmanlar aslında şu soruyu soruyordu: Bu plan hastayı güvende tutuyor mu, kurallara uyuyor mu ve gereksiz taramalardan kaçınıyor mu?

Figure 2
Figure 2.

Yapay Zeka İnsanlarla Nasıl Yarıştı

Tüm 100 vaka boyunca GPT-4o’nun genel takip kalitesi, deneyimli radyoloğunkiyle eşleşti ve asistanı geride bıraktı. Modelin medyan küresel kalite skoru 5 üzerinden 4 idi; bu, uzmanla özdeştir ve eğitim alan uzmana göre belirgin şekilde yüksektir. GPT-4o zamanlamayı tam veya kısmen doğru olarak %96 vakada bildi; bu oran asistanda %75, uzmanda ise %90 idi. Ayrıca potansiyel olarak zararlı zamanlama hatalarında en azı modelde görüldü. Model, takip gerektiren tüm bulguları vakaların %92’sinde ele aldı; bu oran asistanla benzer ve bu özel ölçekte uzmandan açıkça daha iyiydi. Doğru tarama türünü seçme konusunda GPT-4o hem insan okuyucularla neredeyse aynı düzeyde performans gösterdi. Modelin en güçlü olduğu alanlar, kılavuz yollarının özellikle iyi standartlaştırıldığı akciğer, karaciğer ve pankreas görüntülemeleriydi; daha karmaşık olan baş-boyun bölgesinde tüm okuyucular için performans biraz daha düşüktü.

Gelecekteki Bakım İçin Ne Anlama Gelebilir

Çalışma, GPT-4o’nun takip görüntüleme kararlarında güvenilir bir yardımcı olarak görev yapabileceğini; deneyimli bir radyolog düzeyinde ve birçok açıdan bir eğitimliyé kıyasla daha iyi performans gösterebileceğini öne sürüyor. Bir değiştirme aracı değil karar-destek aracı olarak kullanıldığında, böyle bir sistem gereksiz taramaları azaltmaya, gerekli takiplerde gecikmeleri kısaltmaya ve yoğun radyoloji servislerindeki iş yükünü hafifletmeye yardımcı olabilir; aynı zamanda uygulamayı yerleşik kılavuzlara daha yakın tutabilir. Ancak yazarlar insan uzmanların sorumluluğun devam etmesi gerektiğini vurguluyor: model hâlâ raporları yanlış yorumlayabilir, iç işleyişi şeffaf değildir ve çalışma sadece iki merkezden 100 kanserle ilişkili vaka içeriyordu. Bu tür araçların günlük klinik iş akışlarına güvenli biçimde entegre edilmesinden önce daha büyük, prospektif çalışmalar ve güvenli, yerel dağıtımlar gerekecektir.

Atıf: Kaya, K., Müller, L., Persigehl, T. et al. GPT-4o for Automated Determination of Follow-up Examinations Based on Radiology Reports from Clinical Routine. Sci Rep 16, 12587 (2026). https://doi.org/10.1038/s41598-026-40317-9

Anahtar kelimeler: radyoloji takip, büyük dil modelleri, tıbbi karar desteği, onkolojik görüntüleme, GPT-4o