Clear Sky Science · tr

Görsel dönüştürücüler - Kolmogorov–Arnold ağlarına dayalı tüketici odaklı yüzey çatlakları sınıflandırma modeli

2026-02-15 · Dizine geri dön

Günlük Yapılardaki Çatlakların Neden Önemi Var

Yollardaki, köprülerdeki ve bina duvarlarındaki çatlaklar saç teli kadar ince başlangıçlar olabilir, ancak zamanla ciddi güvenlik risklerine ve yüksek maliyetli onarımlara dönüşebilir. Bugün çoğu çatlak denetimi hâlâ kişiler tarafından, not defteri veya kamera ile dolaşarak yapılıyor; bu yöntem yavaş, maliyetli ve özellikle küçük ya da gizli kusurlar söz konusu olduğunda hata yapmaya açık. Bu makale, beton ve asfalt üzerindeki yüzey çatlaklarını çok yüksek doğrulukla tespit edip sınıflandıran, aynı zamanda telefonlar, dronlar veya diğer küçük cihazlarda çalışacak kadar verimli yeni bir bilgisayar tabanlı yöntem sunuyor. Bu, her gün kullandığımız yapıların rutin ve düşük maliyetli izlenmesinin önünü açıyor.

Manuel Denetimlerden Akıllı Kameralara

Yüzeyleri gözle incelemenin belirgin dezavantajları var: subjektif, zaman alıcı ve yoğun trafikli yollar ya da yüksek köprülerde çalışan denetçiler için bazen tehlikeli olabiliyor. Daha önceki bilgisayar programları, fotoğraflarda kenar tespiti ve eşikleme gibi basit numaralarla çatlak aramaya çalıştı, ancak gölgeler, değişen aydınlatma veya çatlak gibi görünen kaba dokularla mücadele etmekte zorlandılar. Daha yeni sistemler ise çok sayıda görüntüden desenleri öğrenen makine öğrenmesi kullanıyor. Konvolüsyonel sinir ağları ve daha yeni görsel dönüştürücüler doğruluğu çok daha ileri taşıdı, ancak çoğu hâlâ gerçek dünya koşullarında ince, düzensiz çatlakları ele almakta güçlük çekiyor ve kararlarının nasıl verildiğini nadiren açıklıyor.

Daha Net Gören Hibrit Bir Yapay Zeka Modeli

Yazarlar, birden çok gücü tek bir boru hattında birleştiren hibrit bir derin öğrenme modeli tasarladı. İlk olarak, MobileNet V3 adlı kompakt bir ağ görüntüye bakıp kenarlar, mikro-çatlaklar ve doku gibi yerel ayrıntıları çıkarıyor. Ardından LeViT adlı bir dönüştürücü model, görüntünün farklı bölgelerinin birbirleriyle nasıl ilişkili olduğunu analiz ederek ince bir çatlağın bir levha boyunca nasıl kıvrıldığını gibi uzun menzilli desenleri yakalıyor. Üçüncü bileşen, geliştirilmiş bir Linformer dönüştürücüsü, yüksek çözünürlüklü görüntülerde bile bu uzun menzilli ilişkileri verimli şekilde modellemeye odaklanıyor; hesaplamayı azaltarak küçük cihazlarda uygulanabilir kılıyor.

Sinyalleri Karıştırmak ve Nihai Kararı Vermek

Bileşenleri basitçe üst üste koymak yerine sistem, her ağdan gelen hangi bilgi parçalarının gerçekten önemli olduğunu ve hangilerinin gereksiz olduğunu öğrenen "kapılı özellik füzyonu" adımı kullanıyor. Bu, modelin çatlak genişliği, uzunluğu ve sürekliliğiyle ilgili faydalı ipuçlarını korumasına ve dikkat dağıtan arka plan desenlerini görmezden gelmesine yardımcı oluyor. Füzyonlu sinyal daha sonra karmaşık ilişkileri esnek matematiksel eğrilerle temsil eden özel bir sinir ağı türü olan Kolmogorov–Arnold Ağı'na geçirilir. Bu sınıflandırıcı, verilerdeki desenler ince veya dağınık olsa bile "çatlak" ve "çatlak değil" durumları arasında keskin bir sınır çizmek üzere ayarlanmıştır; aynı zamanda akıllı telefonlar veya gömülü kartlar gibi uç donanımda gerçek zamanlı kullanım için hızlı ve kompakt kalır.

Yapay Zeka Kara Kutusunu Açmak

Altyapı güvenliği güvene bağlı olduğundan yazarlar modelin kararlarını anlaşılır kılmaya da ağırlık veriyor. Belirli bir tahmini en çok etkileyen görüntü bölgelerini ve özellikleri vurgulamak için SHAP ve LIME olmak üzere iki açıklama aracı uyguluyorlar. Model bir çatlak tespit ettiğinde, bu araçlar tipik olarak çatlak yolu ve onun hemen çevresini vurgulayarak sistemin lekeler veya gölgeler tarafından yanlış yönlendirilmek yerine doğru yerlere "baktığını" doğruluyor. Geliştirme sürecinde bu açıklamalar, asfalt üzerindeki boyalı çizgilere tepki verme eğilimi gibi zayıf noktaları da ortaya çıkardı; bu da ekibi eğitim sürecini ayarlamaya ve yanlış alarmları azaltmaya yöneltti.

Ne Kadar İyi Çalışıyor ve Neden Önemli

Model, birden çok halka açık veri kümesinden alınan 40.000'den fazla fotoğrafı içeren büyük ve çeşitli beton ile asfalt görüntü koleksiyonlarında test edildiğinde yaklaşık %99,5 doğruluğa ulaştı ve daha önce hiç görmediği yeni görüntülerde bile güçlü performansını korudu. Ayrıca birçok rakip yaklaşıma göre daha az hesaplama ve bellek kullanarak çalıştı; bu da tüketici elektroniğine, dronlara ve düşük maliyetli denetim sistemlerine entegrasyonu uygun hale getiriyor. Bu, bir gün ev sahiplerinin, tesis yöneticilerinin ve şehir mühendislerinin sıradan akıllı kameralar veya mobil uygulamalar kullanarak yüzeyleri sürekli izleyip erken çatlak oluşumunu işaretleyebileceği anlamına geliyor; böylece yapısal bakım nadir, manuel bir olay olmaktan çıkarak rutin, veri odaklı bir korumaya dönüşebilir.

Daha Güvenli Yapılara Doğru Bakış

Basitçe söylemek gerekirse çalışma, hafif ağlar, verimli dönüştürücüler ve gelişmiş bir sınıflandırıcının dikkatle tasarlanmış bir karışımının, neden böyle bir sonuca vardığını da açıklayarak çatlaklı ve sağlam yüzeyleri güvenilir biçimde ayırt edebileceğini gösteriyor. Aşırı aydınlatma koşullarıyla başa çıkmak veya çok sınırlı cihaz gücü gibi hâlâ açık zorluklar var, ancak bu çalışma binaların, köprülerin ve yol kaplamalarının otomatik olarak izlenebileceği ve küçük kusurların tehlikeli arızalara dönüşmesini önlemeye yardımcı olabileceği bir geleceğe işaret ediyor.

Atıf: Wahab Sait, A.R., Sankaranarayanan, S. & Yu, Y. Vision transformers- Kolmogorov–Arnold networks-based consumer driven surface cracks classification model. Sci Rep 16, 9183 (2026). https://doi.org/10.1038/s41598-026-40359-z

Anahtar kelimeler: altyapı izleme, beton çatlakları, asfalt kaplama, derin öğrenme, bilgisayarlı görü