Clear Sky Science · tr

Dikkatli özellik taklidi ile görsel anomali tespiti için bir güçlendirme stratejisi

· Dizine geri dön

Görüntülerdeki sıra dışı desenleri fark etmenin önemi

Fabrika ürünlerini küçük kusurlardan arındırmaktan şehir sokaklarındaki olağandışı olayları izlemeye kadar, bilgisayarlardan giderek daha fazla şekle aykırı görünenleri işaretlemeleri isteniyor. Bu makale, yapay zekânın yalnızca eğitim sırasında normal örnekleri görmüş olsa bile normal sahneleri şüpheli olanlardan daha güvenilir şekilde ayırt etmesine yardımcı olacak yeni bir yaklaşım sunuyor.

Figure 1. Öğretmen-öğrenci ağlarının ve dikkat mekanizmasının görüntü ve videolardaki tuhaf olayları ve kusurları nasıl birlikte tespit ettiği.
Figure 1. Öğretmen-öğrenci ağlarının ve dikkat mekanizmasının görüntü ve videolardaki tuhaf olayları ve kusurları nasıl birlikte tespit ettiği.

Bilgisayara normalin nasıl göründüğünü öğretmek

Gerçek dünyada anormallikler nadir ve elle etiketlenmesi zor olduğundan, çoğu sistem yalnızca normal görüntülerden öğrenir ve sonra daha önce görmüş olduklarına uymayan şeyleri tespit etmeye çalışır. Yaygın bir yöntem, bir modeli giriş görüntülerini yeniden oluşturacak (ya da “yeniden yapılandıracak”) şekilde eğitmek ve büyük yeniden yapılandırma hatalarını uyarı işaretleri olarak kabul etmektir. Ancak modern modeller o kadar güçlüdür ki bazen anormal sahneleri bile iyi yeniden oluştururlar; bu da kusurlu ürünlerin veya tuhaf olayların sıradanmış gibi gözden kaçmasına neden olabilir.

Daha güçlü bir rehberden öğrenmek

Yazarlar bu sorunu öğretmen ve öğrenci olarak adlandırılan iki model eşleştirerek ele alıyor. Öğretmen, normal veriler üzerinde yeniden yapılandırma görevini zaten nasıl yapacağını bilen önceden eğitilmiş bir ağdır. Yeni yöntem, öğrenciden sadece görüntüleri yeniden oluşturmasını istemekle kalmıyor, aynı zamanda öğretmenin içsel özelliklerini taklit etmesini de istiyor. Bu gizli özellikler normal sahnelerin genel anlamını ve yapısını yakalar. Bir anormal görüntü gösterildiğinde, yalnızca normal verilerle eğitilmiş öğrenci, öğretmenin içsel tepkilerini kopyalamakta zorlanır. Bu uyumsuzluk, basit piksel düzeyi farklılıkların ötesinde güçlü bir anormalik bulgusu haline gelir.

Uyumsuzluğun izlediği dikkati serbest bırakmak

Bu öğretmen-öğrenci anlaşmazlığından en iyi şekilde yararlanmak için makale, özellik tutarsızlığı tarafından yönlendirilen özel bir dikkat modülü ekliyor. Öncelikle öğretmen ve öğrencinin ürettiği özellikler arasındaki bir “fark haritası” hesaplanıyor. Bu harita normal girdiler için genellikle küçük ve düzgündür, ancak gerçekten anormal bölgelerin etrafında parlıyor. Ardından dikkat modülü bu haritayı kullanarak öğrencinin özelliklerinin bazı kısımlarını güçlendiriyor veya zayıflatıyor ve sistemi uyumsuzluğun en yüksek olduğu bölgelere odaklanmaya teşvik ediyor. Genellikle görsel olarak çarpıcı alanları vurgulayan geleneksel dikkatten farklı olarak, bu dikkat tamamen öğretmen ile öğrenci arasındaki anlamsal tutarsızlıktan kaynaklanır; bu da anomaliyle daha sıkı bir ilişki kurar.

Figure 2. Öğretmen ve öğrencinin özellikleri arasındaki farkların, gerçekten anormal bölgeleri vurgulamak için dikkati nasıl yönlendirdiği.
Figure 2. Öğretmen ve öğrencinin özellikleri arasındaki farkların, gerçekten anormal bölgeleri vurgulamak için dikkati nasıl yönlendirdiği.

Fikri videolarda ve fabrika görüntülerinde kanıtlamak

Araştırmacılar özellik taklidi ve dikkat düzenini gözetim videoları ve endüstriyel ürün görüntüleri için önde gelen birkaç anomali tespit sistemine entegre ediyor. Birleşik yöntemleri üç zorlu ölçüt üzerinde test ediyorlar: kampüs sahnelerindeki olağandışı olaylar için Avenue ve ShanghaiTech ile halılar, metal parçalar ve diş fırçaları gibi nesnelerdeki ve dokulardaki ince kusurlar için MVTec AD. Bu testlerin tümünde geliştirilmiş sistemler orijinal sürümlerinden tutarlı şekilde daha iyi performans gösteriyor; daha fazla anomaliyi yakalıyor ve yanlış alarmları kontrol altında tutuyor. Bazı kategorilerde kusur bölgelerini doğru şekilde saptama doğruluğu yirmi puandan fazla artıyor; bu da özellik tutarsızlığı ve dikkatten gelen ek rehberliğin modelin gözüne önemli ölçüde keskinlik kazandırdığını gösteriyor.

Güvenilir otomatik izleme için ne anlama geliyor

Bir uzman olmayan okuyucu için ana mesaj, bu çalışmanın bilgisayarlara bir görüntüde veya videoda gerçekten "ait olmayan" şeyleri daha iyi anlama yeteneği verdiğidir. Bir öğrenci modelinden sadece gördüğünü kopyalaması değil, aynı zamanda güvenilir bir öğretmenin içsel düşünme biçimini taklit etmesi istenerek ve sonra onların anlaşamadığı alanlara dikkati yönlendirerek, yöntem olağandışı olayların veya kusurların fark edilmeden geçme riskini azaltıyor. Bu, büyük miktarda etiketli anormal örnek gerektirmeden otomatik muayene hatlarını ve gözetim sistemlerini daha güvenilir kılıyor.

Atıf: Zheng, B., Gan, Y., Wang, L. et al. A boosting strategy based on feature mimicking with attention for visual anomaly detection. Sci Rep 16, 15084 (2026). https://doi.org/10.1038/s41598-026-37667-9

Anahtar kelimeler: görsel anomali tespiti, öğretmen öğrenci ağı, dikkat mekanizması, endüstriyel muayene, video gözetimi