Clear Sky Science · tr

Şeker kamışı yaprak hastalığı tanısı için LLM tabanlı açıklamalar içeren bir görsel ve Swin transformer topluluğu

· Dizine geri dön

Neden hasta şeker kamışı yapraklarını tespit etmek önemli

Şeker kamışı şeker, biyoyakıtlar ve birçok kırsal geçim kaynağı için temel bir ürün olup, yaprakları verimi sessizce azaltan çeşitli hastalıklara açıktır. Çiftçiler genellikle görsel muayeneye güvenir; bu yöntem yavaş, tutarsız ve geniş tarlalara ölçeklendirmesi zor olabilir. Bu makale, modern yapay zekânın yaprak fotoğraflarını otomatik olarak okuyarak birden çok şeker kamışı hastalığını yüksek doğrulukla tespit edebilmesini ve sonra bu tahminleri çiftçiler için düz konuşma diliyle önerilere dönüştürmek üzere bir dil modelini nasıl kullandığını inceliyor.

Yaprak fotoğrafları nasıl veriye dönüştürülüyor

Araştırmacılar sistemlerini Kaggle’dan alınmış açık bir şeker kamışı yaprak görüntü koleksiyonunu kullanarak kurdular; koleksiyon yaklaşık yirmi bin renkli fotoğraf içeriyor. Her görüntü altı kategoriden birine ait: sağlıklı veya Bezaklı Yanık (Bacterial Blight), Mozaik, Kızıl Çürüklük (Red Rot), Pas ve Sarı Yaprak Hastalığı dahil olmak üzere beş yaygın hastalık. Fotoğraflar gerçek çiftlik koşullarında çekildiğinden değişen ışık, gölgeler ve karmaşık arka planlar içeriyor. Veriyi hazırlamak için ekip yinelenen ve bozuk görüntüleri kaldırdı, ardından hastalık türlerinin dengesini koruyarak veri setini eğitim, doğrulama ve test olarak böldü. Eğitim sırasında yalnızca eğitim görüntüleri döndürme, çevirme ve yakınlaştırma ile artırıldı; bu, farklı kamera açılarını ve mesafelerini taklit ederek sistemi daha dirençli kıldı, ancak test performansını şişirmedi.

Figure 1
Figure 1.

Yapraka iki tamamlayıcı bakış biçimi

Çalışmanın merkezinde, transformer olarak bilinen iki gelişmiş görsel modeli birleştiren bir “topluluk” (ensemble) bulunuyor. Birincisi, Görsel Transformer (ViT), her görüntüyü yamalar kümesi olarak görür ve tüm yaprak boyunca desenleri aynı anda öğrenir. Bu küresel bakış, geniş, dağınık renk değişimleriyle ortaya çıkan hastalıklar için uygundur. Diğeri, Swin Transformer adlı model, görüntü üzerinde hareket eden daha küçük örtüşen pencerelerle çalışır ve ince dokular ile küçük lekelerin katmanlı bir anlayışını oluşturur. Bu yerel odak, küçük lezyonlar, çizgiler veya benekler şeklinde görünen hastalıklara yardımcı olur. Tasarım itibarıyla ViT geniş renk değişikliklerine duyarlı iken Swin küçük, kümelenmiş ayrıntılara dikkat eder—gerçek yaprak hastalıklarının arazide nasıl göründüğünün iki yönü.

İki model nasıl güçlerini birleştiriyor

Yazarlar karmaşık yeni bir ağ kurmak yerine ViT ve Swin’i basit ve şeffaf bir şekilde birleştiriyor. Her model önce aynı yaprak görüntüsünü inceliyor ve altı sınıf için kendi olasılık puanlarını üretiyor. Bu puanlar daha sonra ek bir eğitilebilir ağırlık olmadan ortalanıyor ve en yüksek birleşik olasılık nihai tanıyı belirliyor. Bu ortalama stratejisi her modelin güçlü yönlerini dengeliyor ve nispeten büyük olsa da belirli bölgeler ve koşulları yansıtan bir veri kümesi üzerinde aşırı uyumdan kaçınıyor. Deneyler, Swin’i geleneksel bir konvolüsyonel ağ ile değiştirmenin kritik yerel ayrıntıyı ortadan kaldırdığını ve yalnızca ViT kullanmanın ince ipuçlarını kaçırdığını gösteriyor—bu, kazancın yalnızca daha fazla modeli yığmaktan değil, küresel ve yerel dikkat’in gerçek sinerjisinden kaynaklandığına dair kanıt sunuyor.

Figure 2
Figure 2.

Sistemin pratikte ne kadar iyi çalıştığı

Yaklaşık üç bin görüntüden oluşan ayrılmış test setinde, topluluk yaklaşık yüzde 97 doğruluğa ulaşıyor; tüm altı sınıf için benzer şekilde yüksek kesinlik, geri çağırma ve F1 skorları görüldü. Sistem, ResNet, EfficientNet, MobileNet ve DenseNet gibi güçlü konvolüsyonel temel modellerin yanı sıra tek tek ViT ve Swin modellerini de geride bırakıyor. Karışıklık matrisi, hataların çoğunun Sarı Yaprak ile Mozaik gibi görsel olarak benzer hastalıklar arasında meydana geldiğini gösteriyor, ancak genel yanlış sınıflandırma oranları düşük kalıyor. Her sınıf için alıcı işletim karakteristiği eğrileri neredeyse mükemmel; bu da topluluğun sağlıklı ile hasta yaprakları ve farklı hastalık türlerini ayırmada yüksek güven ve tutarlılığa sahip olduğunu gösteriyor.

Tahminleri çiftçi dostu rehberliğe çevirme

Ham etiketlerin ötesine geçmek için yazarlar görüntü topluluğunu çevrimiçi barındırılan büyük bir dil modeline (LLM) bağlıyor. Bir yaprak fotoğrafı sınıflandırıldıktan sonra, tahmin edilen hastalık adı LLM’ye gönderiliyor; LLM de çiftçiler ve tarım danışmanları için amaçlanan olası belirtilerin kısa bir açıklamasını ve genel yönetim önerilerini döndürüyor. Hugging Face platformu üzerine kurulmuş bir web arayüzü, kullanıcıların bir yaprak resmi yüklemesine, tahmin edilen hastalığı görmesine ve AI tarafından oluşturulmuş rehberi birkaç saniye içinde okumasına olanak tanıyor. Yazarlar, bu önerilerin danışma amaçlı olduğunu ve LLM’lerin bazen aşırı kendinden emin veya eksik bilgiler üretebileceği için agronomi uzmanları tarafından kontrol edilmesi gerektiğini vurguluyor. Yine de bu dil katmanı sistemi uzman olmayanlar için daha erişilebilir kılıyor.

Geleceğin akıllı tarım araçları için ne anlama geliyor

Basitçe söylemek gerekirse, çalışma aynı yaprağa iki “görme biçimini”—biri ormanı gören, diğeri ağaçları gören—birleştirmenin şeker kamışı hastalıkları için çok güvenilir bir dijital haberci üretebileceğini gösteriyor. ViT ve Swin Transformerların topluluğu hem geniş hem de ince belirtileri yakalıyor, bağlı dil modeli ise teknik tahminleri insan dostu önerilere çevirmeye yardımcı oluyor. Modellerin daha fazla bölge, ışık koşulu ve cihaz üzerinde test edilmesi ve dil çıktılarının uzman onayına ihtiyaç duyması gerekirken, bu çalışma çiftçilerin sorunları erken fark etmelerine, tahminleri azaltmalarına ve şeker kamışı ile nihayetinde birçok başka üründe tedavilerin daha hassas kullanılmasını destekleyecek pratik telefon veya tablet araçlarına işaret ediyor.

Atıf: Saritha, M., Rasane, K. An ensemble of vision and swin transformers with LLM-based explanations for sugarcane leaf disease diagnosis. Sci Rep 16, 10707 (2026). https://doi.org/10.1038/s41598-026-45453-w

Anahtar kelimeler: şeker kamışı hastalığı tespiti, transformer görsel modeller, hassas tarım, bitki yaprağı görüntüleme</keyword-bitki> <keyword>Yapay zeka karar desteği