Clear Sky Science · tr

Görsel dönüştürücüler ve uzamsal-zamansal öğrenme kullanarak gerçek zamanlı yangın ve duman tespiti

2026-03-06 · Dizine geri dön

Neden Daha Hızlı Yangın Uyarıları Önemlidir

Evlerde, fabrikalarda ve ormanlarda yangınlar birkaç dakika içinde ölümcüle dönebilir. Günümüzde birçok alarm hâlâ alevler iyice yerleşene kadar tepki veren ısı veya duman sensörlerine dayanıyor. Bu makale, düşük ışık veya yoğun pus gibi zorlu koşullarda bile kamera görüntülerinde yangın ve duman belirtilerini neredeyse anında tespit edebilen yeni bir bilgisayarlı görü sistemini anlatıyor. Birden fazla gelişmiş yapay zekâ tekniğini tek bir modelde birleştirerek, araştırmacılar itfaiyecilere, şehir planlamacılarına ve çevre ajanslarına çok daha erken bir uyarı sinyali vermeyi—ve dolayısıyla hayatları, mülkleri ve ekosistemleri korumayı—amaçlıyorlar.

Alevleri Tespit Etmenin Büyüyen Zorluğu

Modern şehirler ve ormanlar giderek daha fazla kamera ile izleniyor, ancak bilgisayarlara bu görüntü ve videolarda yangın ile dumanı güvenilir biçimde tanımayı öğretmek zordur. Geleneksel yaklaşımlar durağan görüntülerde veya kısa kliplerde iyi çalışan sinir ağları kullanır, fakat bunlar genellikle karmaşık gerçek dünya sahnelerinde zorlanır. Tek bir kare sis veya egzoz gibi görünen bir şeyi duman sanabilir. Videoya odaklanan sistemler şekillerin zaman içinde nasıl hareket ettiğini izleyebilir, fakat genellikle yavaş ve donanım açısından talepkârdır. Sonuç olarak, önceki modeller sık sık yanlış alarm verir veya özellikle düşük ışıkta, yoğun dumanda veya karmaşık arka planlarda tehlikenin ince, hızlı değişen işaretlerini kaçırır.

Görüntüler ve Video için Hibrit Bir Yapay Zekâ “Gözcüsü”

Yazarlar, yangın tespitini hem uzamsal hem de zamansal bir problem olarak ele alan hibrit bir model öneriyor. Durağan görüntüler için, bir görüntüyü bölgelere ayırıp uzak alanların birbirleriyle nasıl ilişkili olduğunu öğrenen bir tür sinir ağı olan görsel dönüştürücü (vision transformer) kullanıyorlar. Bu, vadinin üzerinden yayılan duman çizgileri veya ormanda dağınık alevler gibi geniş desenleri fark etmesine yardımcı oluyor. Video için sistem, aynı anda birden çok kare yığınıyla çalışan üç boyutlu konvolüsyonel bir ağdan yararlanıyor ve duman ile yangının zaman içinde nasıl değiştiğini yakalıyor. Ardından bir dönüştürücü kodlayıcı bu değişen desenleri inceleyip her kareye eşit ağırlık vermek yerine tehlikeyi gösterme olasılığı en yüksek anlara ve bölgelere dikkat (attention) veriyor.

İpuçlarını Birleştirmek ve Veriyi Dengelemek

Sistemdeki kilit adımlardan biri, detaylı durağan görüntü ipuçlarını videodan elde edilen hareket desenleriyle harmanlayan bir füzyon katmanı. Bu tamamlayıcı görünümleri birleştirerek model, gün batımı parlaklığı, sis veya bulutlar gibi zararsız benzer görüntülerden gerçek yangınları daha iyi ayırt edebiliyor. Araştırmacılar ayrıca birçok açık veri kümesinin yangın örneklerini yangın olmayan örneklerden çok daha fazla içerdiğini fark etti; bu durum modelin alevleri fazla bildirme eğilimi geliştirmesine yol açabiliyor. Bunu dengelemek için parlaklık değiştirme, kırpma, çevirme gibi dikkatli veri artırma işlemleriyle ve sisli sabahlar veya loş iç mekânlar gibi durumları simüle ederek çeşitli gerçekçi yangın-dışı sahneler ürettiler. Ardından model, yangın ve yangın-dışı hatalarını açıkça dengeleyen bir kayıp fonksiyonuyla eğitildi; bu da günlük kullanımda güvenilirliği artırdı.

Sistemi Teste Sokmak

Yaklaşımlarının ne kadar iyi çalıştığını görmek için yazarlar iki yaygın kullanılan veri kümesi üzerinde test yaptılar: NASA Space Apps Challenge’dan yaklaşık bin adet durağan görüntü ve Kaggle’dan yangınla ilgili videolar. Önişleme ve dengelemenin ardından hibrit modellerini ResNet, VGG, LSTM, saf 3B konvolüsyon ağları ve bu eski yöntemlerin birkaç hibrit eşlemesi gibi iyi bilinen temel modellerle birlikte eğitip değerlendirdiler. Yeni sistem NASA görüntülerinde yaklaşık %99.2 doğruluk ve video veri kümesinde %98.3 oranına ulaşıp, tipik olarak orta 80’lerden orta 90’lara kadar değişen geleneksel modelleri açıkça geride bıraktı. Ayrıca kare başına onlarca milisaniye gibi yeterince hızlı çalıştı ve makul bir model boyutuna sahipti; bu da küçük GPU’lar ve gömülü kartlar gibi uç cihazlara dağıtıma uygun olduğunu gösteriyor.

Günlük Güvenlik İçin Anlamı

Günlük terimlerle, bu araştırma düşünülmüş bir yapay zekânın kamera görüntülerini gerçek zamanlı izleyip basit ama hayati bir soruyu güvenilir şekilde yanıtlayabileceğini gösteriyor: “Burada şu anda yangın veya tehlikeli duman var mı?” Geniş görsel bağlamı, zaman içindeki hareketi ve en belirgin ayrıntılara akıllıca dikkat etmeyi birleştirerek hibrit model hem kaçırılan yangınları hem de yanlış alarmları keskin biçimde azaltıyor. Daha fazla ayarlama ve yoğun şehirler, yer altı mekânları ve aşırı hava koşulları gibi daha çeşitli sahnelere maruz kalma ile bu, birçok mevcut çözümden daha hızlı ve daha doğru tepki veren daha akıllı alarm sistemleri, orman yangını izleme ağları ve endüstriyel güvenlik araçları için pratik bir altyapı hâline gelebilir.

Atıf: Lilhore, U.K., Sharma, Y.K., Venkatachari, K. et al. Real time fire and smoke detection using vision transformers and spatiotemporal learning. Sci Rep 16, 8928 (2026). https://doi.org/10.1038/s41598-026-36687-9

Anahtar kelimeler: yangın tespiti, duman tespiti, bilgisayarlı görü, dönüştürücü modeller, gerçek zamanlı izleme