Clear Sky Science · tr

Veri alanı artırma stratejisinin ince kesit kaya sınıflandırmasında model doğruluğu ve genelleme üzerindeki etkisi

· Dizine geri dön

Neden daha akıllı kaya görüntüleri önemli

Yeraltının derinliklerinde, kayaların nasıl bir araya geldiği suyun, petrolün, gazın ve hatta karbondioksitin nerede akıp depolanabileceğini belirler. Jeologlar bu gizli mimariyi okumak için mikroskop altında ultra‑ince kaya dilimlerini incelerler. Artan oranda bilgisayarlar bu tür görüntülerden kaya türlerini tanımak üzere eğitiliyor. Bu makale, uygulamada büyük sonuçları olan aldatıcı derecede basit bir soruyu soruyor: Görüntü koleksiyonlarını "veri artırma" yoluyla yapay olarak genişlettiğimizde gerçekten bilgisayarı daha mı akıllı yapıyoruz—yoksa bazen onu daha mı kötü hale getirebiliyoruz?

Figure 1
Figure 1.

Sınırlı kaya fotoğraflarıyla bilgisayarlara öğretmek

Bir görüntü tanıma sistemi eğitmek genellikle binlerce örnek gerektirir. Jeolojide bu kadar çok mikroskopik kaya görüntüsü toplamak yavaş ve pahalıdır: örneklerin delinmesi, kesilmesi, parlatılması ve fotoğraflanması gerekir ve birçok veri kümesi firmalar tarafından gizli tutulur. Yazarlar, kumtaşı, kireçtaşı ve bazalt gibi 36 kaya kategorisine ayrılmış 34.775 mikroskop görüntüsünden oluşan gerçekçi bir koleksiyonla çalıştı. Ayrıca verinin kıt olduğu yaygın durumu taklit etmek için sınıf başına yalnızca 100 eğitim ve 50 doğrulama görüntüsü içeren küçük bir "sınırlı veri" versiyonu tanımladılar.

Kayaları bozmadan veriyi esnetmek

Sınırlı görüntüleri telafi etmek için araştırmacılar genellikle orijinallerin değiştirilmiş kopyalarını oluşturur—aynalarını çevirme, kaydırma, döndürme, yakınlaştırma veya görüntüleri karıştırma—böylece model ilgisiz farkları göz ardı etmeyi öğrenir. Bu çalışma iki geniş yaklaşımla karşılaştırma yaptı. Statik artırmada, ek görüntüler eğitimden önce oluşturulur ve kaydedilir; veri kümesini kalıcı olarak büyütür. Dinamik artırmada ise bilgisayar eğitim sırasında rasgele dönüşümler üretir; böylece her geçiş aynı kayanın biraz farklı bir versiyonunu görebilir. Ekip 133 ayrıntılı dönüşüm düzenini inceledi—nazik ayna çevirilerden aşırı yakınlaştırma ve döndürmelere kadar, ayrıca iki kayayı matematiksel olarak harmanlayan veya birleştiren daha gelişmiş "görüntü karıştırma" teknikleri yer aldı.

Figure 2
Figure 2.

Beş farklı ağı teste sokmak

Araştırmacılar beş farklı konvolüsyonel sinir ağını eğitti: gündelik fotoğraflar üzerinde ön‑eğitimli üç tanınmış mimari ve sıfırdan oluşturulmuş iki daha basit model. 691 ayrı deney boyunca, farklı artırma stratejileri kullanıldıktan sonra her modelin doğrulama görüntülerini doğru sınıflandırma sıklığını ölçtüler. Hiç artırma yapılmadığında ve bol veri varken, en iyi ön‑eğitimli ağ zaten yaklaşık %98–99 doğruluğa ulaştı. Daha küçük eğitim seti ile doğruluk düştü ve bu da artırmayı potansiyel olarak değerli kıldı—ama sonuçlar gösterdi ki tüm ekstra veriler faydalı değil.

Daha fazla çeşitlilik yarardan çok zarar verebilir

En çarpıcı bulgu, artırmanın iki ucu keskin bir kılıç olduğuydu. Yaygın kullanılan birçok geometrik hile, özellikle güçlü yakınlaştırmalar ve büyük döndürmeler, dinamik olarak uygulandıklarında doğruluğu gerçekten azalttı; bazen dramatik şekilde. Bu işlemler, temel jeolojik bilgiyi taşıyan küçük mineral tanelerini ve dokuları gerip bulanıklaştırabilir ve modelin gerçek örneklerde var olmayan desenlere dikkat etmesini öğretir. Dönüştürülmüş görüntülerin sabit ve tutarlı şekilde tekrar kullanıldığı statik artırma, genelde daha kararlı ve bazen daha iyi sonuçlara yol açtı. Basit çeviriler ve küçük kaydırmalar genellikle güvenliydi, ancak agresif dönüşümler dikkatle kontrol edilmediği sürece riskliydi.

Genelleme için görüntüleri harmanlamak

En umut verici yöntemler, iki kaya görüntüsünü birleştirerek yeni bir eğitim örneği yaratan lineer ve doğrusal olmayan görüntü karıştırma teknikleri oldu. Piksel piksele ortalayan, döşeyen veya birleştiren varyantlar özellikle daha küçük veri kümesi için tutarlı şekilde doğruluğu korudu veya artırdı. Böyle statik karışık görüntülerle eğitilmiş bir model, başka bir yapay zekâ sistemi tarafından üretilmiş sentetik kaya görüntüleri ve arka planı kaldırılmış ya da karmaşık bozulmalar uygulanmış gerçek kayalar gibi daha önce görülmemiş verilere karşı daha iyi genelleme yaptı. Dikkat çekici biçimde, bu artırılmış model, çok daha az orijinal görüntüyle eğitilmiş olmasına rağmen bazen tam, artırılmamış veri kümesiyle eğitilmiş çok daha büyük bir modeli geride bırakabildi.

Geleceğin jeolojik yapay zekâsı için ne anlama geliyor

Uzman olmayanlar için ana mesaj şudur: Basit görüntü hileleriyle yaratılan "daha fazla veri" bir yapay zekâ sistemini otomatik olarak daha güvenilir kılmaz. Mikroskobik kayaların hassas dokularında belirli bozulmalar jeologların önem verdiği özellikleri silip götürebilir. Bu çalışma, dikkatle seçilmiş statik artırmanın ve özenle düşünülmüş görüntü karıştırmanın sınırlı veriyi kısmen telafi edebileceğini ve modellerin yeni, tanımadıkları görüntülerle başa çıkma yetisini iyileştirebileceğini gösteriyor. Aynı zamanda, eleştirel olmayan biçimde uygulanan agresif, dinamik dönüşümler doğruluğu sessizce aşındırabilir. Başka bir deyişle, otomatik kaya sınıflandırması için—ve muhtemelen birçok bilimsel görüntüleme görevi için—yeni eğitim görüntülerini nasıl yarattığımız, kaç tane olduğundan en az onun kadar önemlidir.

Atıf: Habrat, M., Młynarczuk, M. Impact of data space augmentation strategy on model accuracy and generalization in thin-section rock classification. Sci Rep 16, 13927 (2026). https://doi.org/10.1038/s41598-026-44320-y

Anahtar kelimeler: kaya mikroskobu, veri artırma, jeoloji yapay zekâ, görüntü sınıflandırma, ince kesitler