Clear Sky Science · tr

Veriden kararlara: Başlıca üretici ülkelerde soya fasulyesi verimini öngörmek için açıklanabilir YZ kullanımı

· Dizine geri dön

Daha akıllı ürün tahminlerinin önemi

Süpermarket fiyatlarından küresel ticarete kadar, sade soya fasulyesi günlük yaşamda şaşırtıcı derecede büyük bir rol oynar. Hükümetlerin, tüccarların ve çiftçilerin biçerdöverler tarlalara girmeden aylar önce hasadın ne kadar olacağını bilmeleri gerekir. Günümüzde güçlü yapay zeka (YZ) araçları hava durumu ve uydu verilerinin dağlarını tarayarak bu tahminleri yapabiliyor—ancak bu modellerin birçoğu bir “kara kutu” gibi davranır ve belirli bir sonuca nasıl ulaştıkları konusunda çok az içgörü sunar. Bu çalışma, dünyanın başlıca üretici ülkelerinde soya verimini tahmin etmekle kalmayıp, bu tahminleri hangi etkenlerin yönlendirdiğini de açıkça gösteren yeni bir açıklanabilir YZ türünü inceliyor.

Figure 1
Figure 1.

Dünyayı besleyen üç ülke

Araştırmacılar küresel soya arzına hakim olan üç ülkeye odaklandı: birlikte dünya soyasının %80’inden fazlasını üreten Amerika Birleşik Devletleri, Brezilya ve Arjantin. 2018–2022 arasındaki güncel verileri kullanarak ince ölçeğe—ABD’de ilçeler ve Brezilya ile Arjantin’de eşdeğer küçük bölgeler—indiler. Her bölge için ayrıntılı hava kayıtları, toprak özellikleri ve bitki gelişimini, su durumunu ve fotosenteze bağlı zayıf bir ışımayı (güneş kaynaklı klorofil floresansı, SIF) izleyen çeşitli uydu verileri dahil olmak üzere zengin bir büyüme koşulları resmi derlediler. Toplamda, her yetiştirme sezonunu tanımlamak için 154 farklı sayısal özellik çıkarıldı ve modellerin girdisi olarak kullanıldı.

Veri boru hatlarından öğrenen makinelere

Bu bilgi selini yönetmek için ekip standartlaştırılmış bir işleme hattı kurdu. Tüm veri setlerini ürün takvimlerini kullanarak uzay ve zamanda hizaladılar, gürültülü uydu sinyallerini süzdüler ve yetiştirme sezonunu ortalamalar, ekstremler ve değişkenlik gibi istatistiklerle özetlediler. Ardından verimi tahmin etmek için üç tür model eğittiler: yaygın bir makine öğrenimi aracı olan Rastgele Orman (RF); klasik bir derin sinir ağı olan Çok Katmanlı Algılayıcı (MLP); ve baştan sona daha yorumlanabilir olacak şekilde tasarlanmış daha yeni bir mimari olan Kolmogorov–Arnold Ağları (KAN). Kendi kendilerini fazla iyimser skorlarla yanıltmamaları için yazarlar verileri coğrafi bloklara dikkatle böldüler, böylece modeller eğitim sırasında “görmedikleri” bölgelerde test edildi.

YZ’nin kara kutusunu açmak

Bu çalışmayı ayıran nokta yalnızca tahminlerin doğruluğu değil, aynı zamanda modellerin kendilerini nasıl açıkladıklarıdır. RF ve MLP, hangi girdi özelliklerinin tahminlerine ne kadar katkıda bulunduğunu gösteren standart araçlarla incelendi. KAN bir adım daha ileri gidiyor: girdiler ile çıktılar arasındaki bağlantıları çizilebilen ve incelenebilen düzgün, tek boyutlu eğriler olarak temsil ediyor. Bu, örneğin SIF veya toprak nemindeki bir değişikliğin verimi nasıl aşağı veya yukarı ittiğini araştırmacıların kelimenin tam anlamıyla görmesini sağlıyor. Ülkeler ve yöntemler arasında açık bir desen vardı—fotosenteze doğrudan bağlı uydu sinyali olan SIF, soya veriminin en önemli öngörücüleri arasında tutarlı şekilde yer aldı. Diğer ana sürücüler bölgeye göre değişti: ABD’de suyla ilişkili bitki örtüsü sinyalleri öne çıkarken, Brezilya ve Arjantin’de sıcaklık ve toprak nemi daha belirgin roller oynadı.

Figure 2
Figure 2.

Modeller ne kadar iyi performans gösterdi?

Araştırmacılar model doğruluğunu karşılaştırdıklarında, her durumda tek bir yöntemin açık ara kazandığı görülmedi. ABD’de verimler yıl yıl nispeten istikrarlı olduğundan, Rastgele Orman genel olarak biraz daha iyi performans gösterdi, ancak KAN ve MLP yakındı. Daha değişken verimlere ve daha geniş bir veri setine sahip Brezilya’da üç model de yüksek doğruluk sağladı, ancak çok yüksek verimleri tahmin etmekte bir ölçüde zorlandılar. Verilerin daha sınırlı olduğu Arjantin’de KAN genellikle derin öğrenme temel modeli (MLP) üzerinde üstünlük sağladı ve Rastgele Orman’a yaklaştı. Bu sonuçlar, KAN’ın zor, küçük tarımsal veri setlerinde geleneksel modellerle eşleşebileceğini ve aynı zamanda ulaştığı sonuçların nasıl elde edildiği konusunda çok daha fazla şeffaflık sunabileceğini gösteriyor.

Çiftçiler ve gıda güvenliği için anlamı

Gerçek dünya karar vericileri için bir modele güvenebilmek, ham doğruluk kadar önemli olabilir. Bu çalışma, KAN gibi açıklanabilir YZ yaklaşımlarının çevresel ve ürün sinyallerinin hangilerinin en önemli olduğunu açıkça ortaya koyarken rekabetçi soya verimi tahminleri sunabileceğini gösteriyor. Bu görünürlük, bilim insanlarının hataları teşhis etmelerine, uzman tarımsal bilgiyi dahil etmelerine ve modelleri yeni bölgelere veya değişen iklim koşullarına uyarlamalarına yardımcı olur. Uzun vadede bu tür şeffaf araçlar ulusal ürün izleme sistemlerine entegre edilebilir; çiftçilere, planlayıcılara ve piyasalara zayıf hasatlar veya bol ürünler konusunda daha erken ve daha güvenilir uyarılar sağlayarak daha dayanıklı ve sürdürülebilir gıda sistemlerini destekleyebilir.

Atıf: Wang, X., He, Y., Chen, H. et al. From data to decisions: the use of explainable AI to forecast soybean yield in major producing countries. Sci Rep 16, 5103 (2026). https://doi.org/10.1038/s41598-026-35716-x

Anahtar kelimeler: soya verimi tahmini, açıklanabilir yapay zeka, uzaktan algılama, tarımsal modelleme, gıda güvenliği