Clear Sky Science · tr

İstek Yönlendirmeli Büyük Dil Modelleriyle Otomatik RECIST Tümör Cevabı Sınıflandırması

2026-05-27 · Dizine geri dön

Kanser hastaları için neden önemli

Bir kişiye kanser tedavisi uygulandığında, doktorlar bir tedavinin işe yarayıp yaramadığını, değiştirilip değiştirilmemesi gerektiğini veya durdurulup durdurulamayacağını belirlemek için tarama raporlarına güvenir. Bu raporları okumak ve özetlemek zaman alır ve küçük hatalara açıktır. Bu çalışma, metni anlayan bir yapay zeka türü olan büyük bir dil modelinin, hasta verilerini hastane sınırları içinde tutarak tarama raporlarını standart yanıt kategorilerine güvenli biçimde ayırmada doktorlara yardımcı olup olamayacağını araştırıyor.

Doktorlar genellikle tümör değişikliklerini nasıl takip eder

Onkolojide, tümörlerin tedaviye yanıtını kontrol etmek için rutin olarak BT taramaları kullanılır. Doktorlar sıklıkla RECIST adı verilen bir kural seti kullanır; bu set, hastanın durumunu tam yanıt, kısmi yanıt, stabil hastalık, ilerleyici hastalık veya tedavi öncesi başlangıç gibi kategorilere gruplar. Birçok hastane bu raporlar için yarı-yapılandırılmış şablonlar kullansa da, yanıt hakkındaki nihai hüküm genellikle serbest metin halinde yazılır. Bu da ölçümlerin insan bir uzman tarafından yorumlanmasını, önceki taramalarla karşılaştırılmasını ve bunların standart kategorilerden birine çevrilmesini gerektirir; bu süreç yorucu ve zaman zaman tutarsız olabilir.

Figure 1. Çevrimdışı hastane yapay zekası, BT tarama raporlarını okuyup doktorlar için basit tümör yanıtı kategorilerine dönüştürüyor.

Araştırmacıların bilgisayara yaptırmasını istedikleri şey

Alman bir üniversite hastanesindeki ekip, genel amaçlı bir dil modeli olan 70 milyar parametreli LLaMA 3.3’ün gerçek kanser hastalarına ait BT radyoloji raporlarını ek yerel veri eğitimi olmadan okuyup doğru RECIST kategorisini atayıp atayamayacağını test etti. Model, hiçbir hasta bilgisinin kurum dışına çıkmaması için tamamen hastanenin güvenli altyapısı içinde çevrimdışı çalıştırıldı. Model raporları görmeden önce orijinal yanıt etiketleri kaldırıldı; ancak tüm ölçümler ve referans değerler yerinde bırakıldı, böylece sistem güncel tümör boyutlarını önceki başlangıç değerleri veya kaydedilen en küçük boyutlarla karşılaştırabiliyordu.

Yapay zekâyı yönlendirmenin farklı yolları

Araştırmacılar modele ne yapacağını söylemenin üç yolunu denediler; bunlar yönlendirme stratejileri olarak biliniyor. Sıfır-atış (zero-shot) yaklaşımında modele yalnızca rapor ve beş kategoriden birini çıktı olarak vermesine dair kısa bir talimat sunuldu. Az örnekli (few-shot) yaklaşımında modele doğru kategori ile birlikte birkaç örnek rapor parçası gösterilerek göstererek öğretildi. Zincirli düşünce (chain-of-thought) yaklaşımında ise modelden nihai kategoriyi belirtmeden önce akıl yürütmesini adım adım düz metin halinde açıklaması istendi ve çoğunluk kararı için birkaç bağımsız akıl yürütme çalışması birleştirildi. Toplam 142 rapor üzerinden yapay zekânın insan uzmanlarla ne sıklıkta uyuştuğunu doğruluk ve standart sınıflandırma puanlarıyla ölçtüler.

Sistem insan okuyucularla ne kadar uyuştu

Zincirli düşünce stratejisi en iyi performansı gösterdi; genel olarak yaklaşık beş rapordan dördünü doğru sınıflandırdı ve doğru pozitifleri yakalama ile yanlış alarmlardan kaçınma arasında en iyi dengeyi sağladı. Özellikle sık karıştırılan kısmi yanıt ile stabil hastalığı ayırmada iyiydi ve tam yanıt gibi daha nadir sonuçlarda performansı iyileştirdi. Sıfır-atış yönlendirme şaşırtıcı derecede iyi performans gösterdi; bazen birkaç örnek vermekten daha iyi oldu; bu da talimatların nasıl ifade edildiğinin, sadece daha fazla eğitim örneği eklemekten daha önemli olabileceğini gösteriyor. Az örnekli yönlendirme bazı zor kategorilere yardımcı oldu, ancak küçük örnek seti gerçek raporların çeşitliliğini tam yansıtmadığında yeni hatalar da getirebiliyordu.

Figure 2. Yapay zeka bir radyoloji raporunu adım adım inceliyor, tümör değişikliklerini akıl yürütüyor ve birkaç renk kodlu yanıt çıktısından birini atıyor.

Hatalar ve sınırlamalar neyi gösteriyor

Hangi kategorilerin karıştığını gösteren karışıklık matrislerini inceleyerek, yazarlar zincirli düşünce yönteminin daha az sistematik hata ürettiğini ve dikkatli klinik akıl yürütmeyi andıran bir desen sergilediğini buldular. Ancak model, başlangıç taraması ile görünür tümör kalmayan daha sonraki bir taramayı metnin açıkça ayırt etmediği sınır durumlarda hâlâ zorlandı. Çalışma, standart şablonları izleyen tek bir kurumun raporlarını kullandı; bu yüzden daha gevşek yazım stilleri olan hastanelerde sonuçlar farklı olabilir. Çalışma her seferinde tek bir rapora odaklandı ve bazı resmi çalışma kurallarının gerektirdiği çoklu ziyaretlere yayılan daha uzun geçmişleri henüz içermedi.

Gelecekte kanser bakımına ne anlam ifade edebilir

Halk için ana mesaj, metin okuyan bir yapay zekânın radyologlara, BT raporlarında yazılı sonuçların taramdaki rakamlar ve kanser tedavisi kararlarını yönlendiren kurallarla uyumlu olup olmadığını çift kontrol ederek yardımcı olabileceğidir. Sistemin tamamen çevrimdışı çalıştırılması hasta mahremiyetini korurken manuel iş yükünü azaltabilecek ve tutarsızlıkları ortaya çıkarabilecek ölçeklenebilir bir araç sunar. Yazarlar bu tür modellerin klinisyenleri desteklemesi gerektiğini, yerine geçmemesi gerektiğini ve daha fazla hastanede doğrulanıp insan incelemesiyle entegre edilmesi gerektiğini vurguluyor. Dikkatle geliştirilirse, bu tür sistemler bir tarama raporunda anlatılanın görüntülerdeki gerçeklerle ve tedaviyi yönlendiren standartlarla daha güvenilir biçimde örtüşmesine yardımcı olabilir.

Atıf: Mergen, M., Busch, F., Sauter, A.P. et al. Automated RECIST tumor response classification through prompt-guided large language models. Sci Rep 16, 16433 (2026). https://doi.org/10.1038/s41598-026-54979-y

Anahtar kelimeler: radyoloji yapay zekası, tümör yanıtı, RECIST, büyük dil modelleri, onkoloji raporlaması