Clear Sky Science · tr
Çoklu örnek dikkat mekanizmaları kullanarak endoskopik histopatolojide adenokarsinomun dijital patolojisi için AI altyazı oluşturma modeli
Slaytları sözcüklere dönüştürmenin önemi
Doktorlar mide kanısından şüphelendiğinde, mide zarından küçük doku örnekleri alınır ve mikroskop altında incelenir. Bu slaytları yorumlamak patologlar için uzmanlık gerektiren ve zaman alan bir iştir; hazırladıkları yazılı rapor sonraki tüm tedavi kararlarını yönlendirir. Bu çalışma, şaşırtıcı derecede insana özgü bir şey yapan bir yapay zeka (AI) sistemi sunar: gastrik biyopsi slaytlarının dijital görüntülerine bakar ve bir patologun raporuna benzeyen kısa, yapılandırılmış açıklamaları otomatik olarak yazar.
Cam slaytten dijital yardımcıya
Mide adenokarsinomu, mide kanserinin yaygın ve ölümcül bir formu, şu anda biyopsi örneklerini görsel olarak inceleyen patologlar tarafından teşhis edilir ve derecelendirilir. Son on yılda birçok hastane cam slaytları çok büyük dijital görüntülere taramaya başladı; bu da teşhise yardımcı olabilecek AI araçlarının yolunu açtı. Önceki sistemler çoğunlukla kanserin var olup olmadığı gibi evet‑hayır sorularına veya bir kategori atamaya odaklandı. Oysa gerçek patoloji raporları anlatısaldır: hücre şekillerini, doku desenlerini ve tümörün ne kadar agresif göründüğünü tanımlar. Tüm slayt görüntülerinden doğrudan bu tür betimleyici altyazılar üretmeye çalışan yalnızca birkaç araştırma girişimi var ve bunların çoğu önceden tanımlanmış alt tipleri gösteren ek etiketlere dayanıyor; bu etiketler maliyetlidir ve her zaman mevcut değildir.

AI’nın birçok küçük parçayı okuması için yeni bir yol
Yazarlar, özellikle gastrik adenokarsinom biyopsi slaytları için tasarlanmış MIAC (Multi‑instance Attention Captioning) adlı bir altyazı modeli sunuyor. Tek bir dijital slayt bir modele aynı anda verilemeyecek kadar büyüktür; bu yüzden birçok küçük kare görüntüye, yani yamalara bölünür. MIAC, çoklu‑örnek öğrenimi olarak bilinen bir yaklaşım kullanır: bu yamaları sıralı bir dizi olarak ele almak yerine bir küme olarak görür; bu, yamaların sayısının ve düzeninin günlük uygulamada olduğu gibi slayttan slayta değişmesine izin verir. Güçlü bir görüntü ağı her yama için görsel özellikleri çıkarır. Ardından, konum bilgisi olmadan kurulan bir kendi‑dikkat mekanizması, her yamanın nihai özet üzerinde ne kadar etkili olması gerektiğini öğrenir. Model bu sinyalleri tüm slaytın tek bir kompakt temsiline birleştirir ve ardından bu temsil, dil modülüne beslenir; dil modülü cümle uzunluğunda tanısal bir altyazıyı kelime kelime üretir.
Gerçek raporlarla eğitim, farklı bir hastanede test
MIAC’i öğretmek için araştırmacılar, Japonya’daki bir hastaneden neredeyse bin taranmış biyopsi slaytı içeren PatchGastricADC22 adlı halka açık bir veri kümesini kullandılar. Her slayt, orijinal patoloji raporundan alınmış ve standartlaştırılmış terminolojiye dönüştürülmüş kısa bir tanısal cümle ile eşleştirildi. Slaytlar yüzlerce yamaya bölündü ve modele, bu yamaların bir alt kümesi verildiğinde orijinal altyazıyı üretmesi için eğitim verildi. Performans, yapay zekâ tarafından üretilen açıklamaların uzman metinle ne kadar yakından eşleştiğini değerlendiren standart dil karşılaştırma skorlarıyla ölçüldü. MIAC, tüm metriklerde önceki en iyi yöntemi geride bıraktı; özellikle eğitim sırasında slayt başına daha fazla yama görmesine izin verildiğinde, dağınık yerel görüntülerden slayt düzeyindeki resmi yakalamada daha iyi olduğu görüldü.

Hastaneler arasındaki farkları ele almak
Herhangi bir tıbbi AI sisteminin önemli bir sorusu, veriler yeni bir kaynaktan geldiğinde hâlâ işe yarayıp yaramadığıdır. Bu nedenle ekip, MIAC’i başka bir hastanede toplanmış ve altyazıları başka bir patolog tarafından yazılmış bağımsız bir gastrik biyopsi slaytı seti üzerinde test etti. Bu görüntüler, yerel boyama ve tarama uygulamaları nedeniyle renkte farklılık gösteriyordu; bu, görüntü tabanlı modellerin tökezleyebileceği yaygın bir sorundur. Araştırmacılar, eğitim slaytlarının tonlarına daha yakın olacak şekilde boyama tonlarını ayarlayan yaygın kullanılan bir renk‑normalizasyon tekniği uyguladı. Daha fazla ince ayar yapılmadan bile MIAC, bu dış veri kümesinde klinik olarak anlamlı altyazılar üretti; renk normalizasyonu uygulandığında ve her slayttan daha fazla yama örneklendiğinde performansı iyileşti.
Hasta bakımına ne anlama gelebilir
MIAC, patologların yerini almak için tasarlanmamıştır; bunun yerine uzmanların hızla gözden geçirip düzenleyebileceği kısa, standartlaştırılmış açıklamalar taslak olarak hazırlamayı hedefler. Yoğun klinik ortamlarda veya uzman erişiminin sınırlı olduğu bölgelerde böyle bir araç raporlama süresini kısaltabilir, ifade farklılıklarını azaltabilir ve karmaşık desenleri olan vakaları daha yakından inceleme için işaretleyebilir. Çalışma ayrıca mevcut sınırları vurgular: model yeni kurumlardan gelen slaytlarla veya alışılmadık doku desenleriyle karşılaştığında performansı hâlâ düşer ve otomatik dil skorları klinik kullanışlılığı tam olarak yakalamaz. Yazarlar, bu tür altyazı üreten sistemlerin günlük tanısal iş akışlarına güvenli şekilde entegre edilmesinden önce daha zengin, çok merkezli veri kümelerine, hangi yamaların inceleneceğini seçmenin daha akıllı yollarına ve patologlardan doğrudan geribildirimlere ihtiyaç olacağını savunuyorlar.
Atıf: Lee, Y., Bai, K., Kim, Y. et al. AI caption generation model for digital pathology of adenocarcinoma in endoscopic histopathology using multi-instance attention mechanisms. Sci Rep 16, 13244 (2026). https://doi.org/10.1038/s41598-026-37455-5
Anahtar kelimeler: mide kanseri, dijital patoloji, tıbbi yapay zeka, görüntü altyazılama, histopatoloji