Clear Sky Science · tr
Yapılandırılmış yönlendirmelerle ince ayarlanmış büyük dil modelleri, akciğer kanseri bilgi grafikleri oluşturmayı verimli hale getiriyor
Tıbbi metinleri haritalara dönüştürmenin önemi
Akciğer kanseri, dünyanın en ölümcül kanserlerinden biridir ve teşhis ile tedaviye ilişkin bilgiler araştırma makaleleri, hastane notları, çevrimiçi danışmalar ve geleneksel tıp vaka kayıtları arasında dağınık halde bulunur. Hekimler ve araştırmacılar bu metin seline ayak uydurmakta zorlanır. Bu çalışma, bu dağınık bilgiyi otomatik olarak tek, gezilebilir bir “harita”ya—akciğer kanseri bilgi grafiğine—dönüştürmenin yeni bir yolunu araştırıyor; yöntem, ince ayarlanmış büyük bir dil modeli ve dikkatle yapılandırılmış yönlendirmeler kullanıyor. Elde edilen sonuç, karmaşık tıbbi bilgiyi bilgisayarlar için daha kolay aranır ve uzmanlar için karar destek araçlarında daha kullanılabilir hâle getirmeyi amaçlıyor.
Dağınık hikâyelerden bağlı gerçeklere
Yazarlar basit bir fikre odaklanıyor: tıbbi metinden kim-ne-yapıyor-neye güvenilir biçimde çıkarılabiliyorsa, o gerçekleri bir grafikte birleştirebilirsiniz. Pratikte bu, serbest biçimli cümleleri “üçlüler” adı verilen küçük yapı taşlarına dönüştürmek anlamına geliyor—iki varlık ve bunları birbirine bağlayan bir ilişki, örneğin “akciğer kanseri – tedavi edilir – kemoterapi.” Bu tür grafikleri oluşturmanın geleneksel yolları ya ordular hâlinde etiketleyici gerektirir ya da nüansı ve yeni keşifleri kaçıran kırılgan kurallara dayanır. Bunu aşmak için ekip, mevcut bir Çin dilinde büyük dil modeli ChatGLM-6B’yi ince ayarlayarak, çevrimiçi hasta-hekim sohbetlerinden yapılandırılmış veritabanlarına ve geleneksel Çin tıbbı kayıtlarına kadar çeşitli kaynaklardaki akciğer kanserine ilişkin tıbbi anlamlı üçlüleri tespit etmede uzmanlaşmasını sağladı. 
Bir yapay zekâyı düzenli birimlerle düşünmeye öğretmek
Genel amaçlı bir dil modelinden yalnızca “bilgi çıkar” diye istemek genellikle dağınık, sohbete benzer yanıtlar verir. Bu nedenle araştırmacılar sıkı bir yönlendirme şeması tasarlayıp modeli yaklaşık 50.000 iyi örnek üzerinde ince ayarlıyor. Her örnek bir talimat ve beklenen tam üçlü biçimindeki çıktıyı gösteriyor. Yönlendirme, modele profesyonel bir metin madenciliği uzmanı gibi davranmasını, yalnızca bilgisayar tarafından okunabilir formatta yapılandırılmış üçlüler üretmesini ve cümlelerde iç içe geçmiş ayrıntılar olduğunda—örneğin bir tedavi, kullanılan ilaç ve dozu—“adım adım düşünmesini” söylüyor. Rol belirleme, format kuralları ve adım adım akıl yürütmeyi birleştirmek, modeli—şimdi KGLM olarak adlandırılıyor—konuşmacı bir asistandan makineye hazır gerçekleri disiplinli biçimde çıkaran bir araca dönüştürüyor.
Birçok sesi tek, açık bir grafikte harmanlamak
Ham metinlerden elde edilen üçlüler hikâyenin yalnızca bir parçası. Aynı hastalık ya da ilaç sık sık farklı adlarla ortaya çıkar—örneğin “kronik obstrüktif akciğer hastalığı” ile “KOAH” gibi. Karmaşa ve kafa karışıklığını önlemek için yazarlar, yapılandırılmamış web metni, yarı yapılandırılmış klinik vakalar ve mevcut tıbbi bilgi grafiklerinden gelen üç veri akışında eşdeğer varlıkları birleştiren bir füzyon aşaması tasarlıyor. İlk olarak hızlı bir dize tabanlı benzerlik kontrolü bariz eşleşmeleri işaretliyor. Bu yeterli olmadığında, daha derin bir anlamsal benzerlik modeli (Sentence-BERT) bağlam içindeki anlamları karşılaştırıyor. Eşdeğer olduğu değerlendirilen varlıklar tek bir kanonik düğümde birleştiriliyor; kısa isimler tercih ediliyor ve diğer biçimler takma ad (alias) olarak saklanıyor. Uzmanlar daha sonra köşe durumlarını gözden geçirip yanıltıcı veya düşük kaliteli ifadeleri çıkarıyor ve sonuçta Neo4j veritabanında saklanan daha temiz ve tutarlı bir akciğer kanseri bilgi grafiği elde ediliyor. 
Bu bilgi haritası ne kadar iyi çalışıyor?
Performansı ölçmek için ekip, KGLM’yi BERT ve konvolüsyonel ağlara dayanan standart derin öğrenme yaklaşımları ile orijinal, ince ayar yapılmamış ChatGLM modeliyle karşılaştırıyor. İlişki çıkarımı görevinde—hangi varlıkların nasıl bağlı olduğunu belirleme—ince ayarlı ve yönlendirme destekli KGLM yaklaşık 0,82 F1 skoruna ulaşıyor; test edilen tüm temel yöntemleri geride bırakıyor ve başlangıç modeline göre yaklaşık yüzde 25’lik bir iyileşme sağlıyor. Ayrıştırma (ablation) testleri, her bir yönlendirme bileşeninin önemli olduğunu gösteriyor: uzman rolünün, katı üçlü formatının veya “adım adım düşünme” rehberliğinin kaldırılması doğruluğu bozuyor; özellikle iç içe geçmiş öznitelikler veya geleneksel Çin tıbbı terminolojisi içeren karmaşık cümlelerde. Klinik ve bilişim uzmanlarından oluşan bir panel de ortaya çıkan grafiğin, ince ayar veya yapılandırılmış yönlendirmeler olmadan oluşturulan grafiklere göre daha doğru, kullanılabilir ve klinik açıdan daha ilgili olduğunu değerlendiriyor.
Gelecekteki tıbbi araçlar için bunun anlamı
Basitçe ifade etmek gerekirse, çalışma doğru eğitim ve talimatlarla büyük bir dil modelinin dağınık, gerçek dünya akciğer kanseri metnini yapılandırılmış, aranabilir bir gerçek ağacına verimli biçimde dönüştürebileceğini gösteriyor. Bu akciğer kanseri bilgi grafiği hâlâ bir araştırma prototipi olup Çinçe kaynaklar ve tek bir hastalık alanıyla sınırlı olsa da, sürekli güncellenen “bilgi haritaları”nın karar destek sistemleri, eğitim araçları ve araştırma keşfi için destek sağlayabileceği bir geleceğe işaret ediyor. Yazarlar böyle grafiklerin dikkatle doğrulanması ve düzenli olarak güncellenmesi gerektiğini; uzman denetimi olmadan bakımda rehberlik etmeye hazır olmadıklarını vurguluyor. Yine de bulguları, ince ayarlanmış dil modelleri ve akıllı yönlendirmelerin tıbbi bilgiyi düzenleme gibi zorlu bir görevi daha ölçeklenebilir ve zamanında hâle getirebileceğini gösteriyor.
Atıf: Zhou, C., Gong, Q., Luan, H. et al. Fine-tuned large language models with structured prompts enable efficient construction of lung cancer knowledge graphs. Sci Rep 16, 9505 (2026). https://doi.org/10.1038/s41598-026-38959-w
Anahtar kelimeler: akciğer kanseri, bilgi grafiği, büyük dil modeli, ilişki çıkarımı, tıp yapay zekâsı