Clear Sky Science · tr

CancerLLM: kanser alanında büyük bir dil modeli

· Dizine geri dön

Hastalar ve hekimler için bunun önemi

Kanser bakımı, doktor notlarından laboratuvar raporlarına kadar büyük hacimli metinleri anlamaya dayanır. Bu metinleri okuyan yapay zekâ sistemlerinin çoğu genel amaçlıdır, kanser uzmanı değildir; ayrıca genellikle çok büyük, maliyetli ve hastaneler için çalıştırması zordur. Bu makale, kanser kayıtları üzerinde özel olarak eğitilmiş daha küçük bir dil modeli olan CancerLLM’yi tanıtıyor; bu model, bir hastanın kanserini anlamada daha doğru yardım vaat ediyor ve çok daha az hesaplama kaynağıyla çalışabiliyor.

Figure 1
Figure 1.

Kanser odaklı yeni bir dijital asistan

Araştırmacılar, onkoloji dilinde “düşünen” bir dil modeli inşa etmeyi amaçladılar. Açık web’i kazımak yerine, CancerLLM’yi 17 kanser türünden — meme, akciğer, kolorektal ve lösemi dahil — 30.000’den fazla hastaya ait 2,7 milyon klinik not ve yarım milyondan fazla patoloji raporu üzerinde eğittiler. Mevcut 7 milyar parametreli bir model mimarisinden başlayıp, bu kanser açısından zengin veri üzerinde eğitimi sürdürdüler; ardından modelin bir dijital asistana doktorun sorabileceği türden görev‑stil talimatları takip etmeyi öğrenmesi için ikinci bir aşama uyguladılar.

Karmaşık raporlardan kilit ayrıntıları çıkarmaya yardımcı olmak

CancerLLM’nin bir ana görevi “fenotip çıkarımı”dır: serbest metin raporlardan belirli kanser özelliklerini çıkarmak. Bu özellikler tümörün yeri, boyutu, derecesi ve evresi ile tedaviyi yönlendiren hormon reseptörlerinin durumu gibi bilgileri içerir. Geleneksel sistemler bunu token token etiketleme problemi olarak ele alırken, yazarlar bunu bir soru‑cevap görevine dönüştürdüler. Her rapor cümlesi için modelden “Tümörün boyutu nedir?” veya “Kanserin evresi nedir?” gibi basit sorulara ilgili ifadeyle yanıt vermesi veya sorunun alaka düzeyi yoksa bunu belirtmesi istendi. Bu görevde CancerLLM, birçok daha büyük genel tıbbi modeli eşdeğer veya geride bıraktı; son derece yüksek doğruluk elde ederken pratik klinik kullanım için yeterince kompakt kaldı.

Dağınık notlardan net bir tanıya

İkinci ana görev tanı üretimidir. Burada modele bir kanser randevusuna ait gerçekçi bir kesit verilir: klinige başvuru nedenleri, tedavi bölgesi, semptomlar, hemşire gözlemleri, fizik muayene bulguları ve test sonuçları. Modelin ardından akciğer kanseri veya non‑Hodgkin lenfoma gibi doğru kanser tanısını üretmesi gerekir. Geniş bir kıyaslama boyunca CancerLLM, parametre sayısı on kat daha fazla olan tanınmış tıbbi modelleri önemli ölçüde geride bırakarak ortalama olarak birleşik doğruluk puanını dokuzdan fazla yüzde puan artırdı. Daha önce “görülmemiş” 2.000 hastadan oluşan bağımsız bir test grubunda da CancerLLM en önde çıktı; bu da modelin yalnızca önceki vakaları ezberlemek yerine yeni hastalara genelleme yapabildiğini gösteriyor.

Figure 2
Figure 2.

Dağınık gerçek dünya verisinde dayanıklılığı test etmek

Gerçek klinik kayıtlar temiz değildir: yazım hataları, kısaltmalar ve zaman zaman etiketleme yanlışları içerir. Ekip, modelin böyle gürültü altında ne kadar kırılgan veya dayanıklı olduğunu sınamak için iki özel test platformu kurdu. Birinde, yanlış etiketlenmiş verileri taklit etmek için eğitim sırasında kasıtlı olarak yanlış yanıtlar karıştırdılar ve CancerLLM’nin özellikle hata oranı çok yüksek olduğunda karşılaştırılabilir modeller kadar iyi veya daha iyi dayandığını buldular. Diğerinde ise farklı oranlarda “cnacer” yerine “cancer” gibi yazım hataları eklediler. Hata arttıkça hem CancerLLM hem de güçlü karşılaştırma modeli performans düşüşleri gösterdi; bu, gelişmiş yapay zekânın bile dağınık metne duyarlı olduğunu ve dikkatli veri girişi ile ön işlemenin hâlâ çok önemli olduğunu vurguluyor.

Hız, verimlilik ve mevcut sınırlamalar

Hastanelerde donanım bütçeleri kısıtlı olduğundan, araştırmacılar hesaplama süresi ve bellek kullanımını da karşılaştırdı. 70 milyar parametreli büyük modeller bazı çıkarım görevlerinde biraz daha iyi performans gösterebilirken, birkaç kat daha fazla belleğe ve çok daha uzun işlem sürelerine ihtiyaç duyuyordu. Buna karşılık CancerLLM, çıkarım ve tanı her iki görevde de önde veya önde gelen doğruluklar sunarken tek bir yüksek uç grafik kartında mütevazı bellek gereksinimleriyle çalışabiliyordu. Hata analizleri modelin hâlâ çok ince ayrımlarda—örneğin ince kanser alt tipleri, eksiksiz evreleme ayrıntıları ve notlarda sık kullanılan kısaltmalar veya yazım hatalarının yoğun kullanımı—zorlandığını gösterdi; bu da daha fazla veri temizliği ve gelecekte model iyileştirmeleri gerektiğini işaret ediyor.

Kanser yapay zekâsının geleceği için ne anlama geliyor

Günlük terimlerle CancerLLM, tıbbi kayıtlardan kritik ayrıntıları hızla süzüp muhtemel kanser tanıları önerebilen, kompakt ve kanser odaklı bir metin okuyucu gibidir; ayrıca hastaneler için çalıştırılması da gerçekçidir. Onkologların yerini almaz, ancak onların zamanından tasarruf sağlayabilir, araştırma çalışmalarını destekleyebilir ve karmaşık tabloların içindeki kaçırılmış ayrıntıları azaltabilir. Model çerçevesini ve sentetik veri setlerini yayımlayarak yazarlar, tek tip sistemler yerine belirli tıbbi alanlara uyarlanmış, güvenilir ve verimli yapay zekâ araçları üzerinde daha fazla çalışmayı teşvik etmeyi amaçlıyorlar.

Atıf: Li, M., Zhan, Z., Huang, J. et al. CancerLLM: a large language model in cancer domain. npj Digit. Med. 9, 266 (2026). https://doi.org/10.1038/s41746-026-02441-8

Anahtar kelimeler: kanser yapay zekası, klinik metin madenciliği, tanı desteği, tıbbi dil modelleri, onkoloji bilişimi