Clear Sky Science · tr
Denetimli kontrastif öğrenmeyle X-ışını görüntüleri için hafif çok-ölçekli tespit çerçevesi
Daha akıllı X-ışını kontrolleri neden önemli
Havaalanı güvenliğinden sabırla geçen herkes bilir ki her çanta hızlı ve doğru şekilde taranmalıdır. Ancak X-ışını görüntüleri hiç de basit değildir: bıçaklar, şişeler, dizüstü bilgisayarlar ve şarj cihazları üst üste yığılır; tehlikeli nesneler kolayca karışıklığın içinde saklanabilir. Bu makale, X-ışını makinelerinin küçük veya üst üste binmiş tehditleri daha güvenilir tespit etmesine yardımcı olan yeni bir yapay zeka (YZ) yöntemini sunuyor; üstelik yoğun noktalar için hâlâ yeterince hızlı çalışıyor.

Karışıklığın içinden görmenin zorluğu
X-ışını güvenlik sistemleri, havaalanları, metro istasyonları ve diğer kalabalık kamu alanlarında ilk savunma hattıdır. Geleneksel insan denetimi yavaş ve yorucudur; bu da gözden kaçan nesne riskini artırır. YOLO ailesi gibi modern YZ dedektörleri otomatik taramayı iyileştirdi, fakat bunlar başlangıçta hayaletimsi, düşük kontrastlı X-ışını görüntüleri için değil, gündelik fotoğraflar için tasarlanmıştır. Bu taramalarda nesneler sıkça üst üste biner, yarı saydam görünür ve boyutları büyük ölçüde değişir. Küçük bıçaklar veya şişeler zararsız eşyaların arasında gömülebilir ve birçok mevcut algoritma ya bunları kaçırır ya da kompakt, düşük maliyetli makinelerde çalıştırılması zor olan ağır hesaplama gücü gerektirir.
X-ışını makineleri için daha yalın bir beyin
Yazarlar popüler YOLOv8 dedektörünü temel alıp onu özellikle X-ışını görüntüleri için yeniden tasarlıyor. İlk adım olarak ağı “derinlik ayrık” (depthwise separable) konvolüsyonlarla inceltiyorlar — teknik olarak modelin desenleri daha tutumlu şekilde incelediğini söylemenin bir yolu. Görüntünün her kanalına büyük, maliyetli filtreler uygulamak yerine işlemi daha ucuz adımlara bölüyorlar. Bu değişiklik hesaplama sayısını yaklaşık dörtte bir ile iki beşte bir oranında azaltıyor, ancak yine de küçük, kısmen gizlenmiş nesneleri tespit etmek için gereken ince ayrıntıları koruyor. Sonuç, tarayıcıların içindeki gömülü işlemciler gibi mütevazı donanımlarda gerçek zamanlı çalışabilecek daha hafif bir dijital “beyin”.
Modelin önem taşıyan noktalara odaklanmasına yardımcı olmak
Ağı küçültmek yeterli değil; aynı zamanda daha seçici olmalı. Bu amaçla araştırmacılar Kanal-Mekânsal Dikkat Birleştirme (Channel-Spatial Attention Fusion, CSAF) modülünü tanıtıyor. Bu modülün bir dalı hangi görsel özellik türlerinin —kenarlar, şekiller veya malzeme ipuçları— genel olarak en bilgilendirici olduğunu öğrenirken, diğer dalı görüntüde eylemin nerede gerçekleştiğini öğreniyor. Bu dikkat mekanizmalarını ardışık olarak uygulamak yerine CSAF bunları paralel işliyor ve sonra birleştiriyor, böylece sistem aynı anda hem “ne”yi hem de “nerede”yi değerlendirebiliyor. Bu dikkat birimleri, sahnenin kaba ve ince görünümlerini birleştiren çok-ölçekli bir tasarıma işlenmiş; bu da kalabalık çantalardaki küçük, üst üste binmiş nesneleri tespit etmek için özellikle yararlı.

Benzer görünenleri ayırmayı öğretmek
X-ışını taramalarındaki bir diğer zorluk, birçok eşyanın birbirine benzemesi: bir teneke kutu ile bir sprey kutusu veya farklı tür bıçaklar hemen hemen aynı dış konturlara sahip olabilir. Modelin bu kategoriler arasındaki farkları daha iyi ayırt etmesi için yazarlar kontrastif öğrenme hedefi ekliyor. Eğitim sırasında ağ, aynı sınıfa ait örnekleri iç temsilinde birbirine daha yakın tutmaya; farklı sınıfları ise birbirinden uzaklaştırmaya teşvik ediliyor. Aynı zamanda PIoU adı verilen piksel düzeyinde örtüşme ölçüsü, öngörülen sınırlayıcı kutuların yerleşimini ve şeklini hassaslaştırmaya yardımcı oluyor; bu, nesneler eğilmiş, kalabalık ya da kısmen görünür olduğunda hayati önem taşıyor. Bu kayıplar birlikte modele bir nesnenin nerede olduğunu ve onu kafa karıştırıcı komşulardan ayıran özellikleri öğretiyor.
Gerçekçi testlerle performansı kanıtlama
Ekip yaklaşımlarını gerçek kontrol noktalarını ve birden çok tehdit kategorisi içeren sentetik bagaj sahnelerini içeren iki zor X-ışını veri kümesi üzerinde değerlendiriyor. Standart YOLOv8 temel modeline kıyasla, onların modeli daha sıkı örtüşme ölçülerinde daha yüksek doğruluk elde ederken daha az parametre ve daha az hesaplama kullanıyor. Keskin nesneler için çok yüksek tespit oranlarını koruyor ve şişeler ile içecek kartonları gibi şeffaf veya deformasyona uğrayan nesnelerin tanınmasını iyileştiriyor. Kesinlik–güven ve duyarlılık–güven eğrileri, tespit bildirmede eşik yükseltilse bile tahminlerinin istikrarlı kaldığını gösteriyor; bu da daha az yanlış alarm ve daha az kaçırılan tehdit anlamına geliyor. Başka bir yerde toplanmış ikinci bir veri kümesi üzerinde yapılan testler, sistemin genelleme yeteneğinin iyi olduğunu doğruluyor; bu, çanta içeriği ve görüntüleme koşullarının değiştiği gerçek dünya dağıtımları için önemli bir gereklilik.
Günlük yolcular için bunun anlamı
Bir uzman olmayan kişi için sonuç şu: bu çalışma bagaj taramaları için daha akıllı, daha yalın bir yol sunuyor. Modern bir YZ dedektörünü hem hafif hem de daha ayırt edici olacak şekilde yeniden tasarlayarak yazarlar, uygun maliyetli donanımlarda hızlı çalışabilecek ve yine de küçük, üst üste binmiş veya benzer görünen tehditleri yakalayabilen X-ışını makinelerini mümkün kılıyor. Bu yöntemler uygulanırsa, kuyrukları kısaltabilir, gereksiz çanta aramalarını azaltabilir ve en önemlisi gerçekten tehlikeli eşyaların kapıya ulaşmadan önce yakalanma olasılığını artırabilirler.
Atıf: Diao, Q., Chan, W., Zain, A.M. et al. A lightweight multi-scale detection framework for X-ray images with supervised contrastive learning. Sci Rep 16, 8635 (2026). https://doi.org/10.1038/s41598-026-38000-0
Anahtar kelimeler: X-ışını güvenliği, nesne tespiti, derin öğrenme, havaalanı kontrolü, bilgisayarlı görme