Clear Sky Science · ar

اكتشاف الحريق والدخان في الوقت الحقيقي باستخدام محولات الرؤية والتعلم الزماني المكاني

· العودة إلى الفهرس

لماذا تهم تنبيهات الحريق الأسرع

يمكن أن تتحول الحرائق في المنازل والمصانع والغابات إلى مواقف قاتلة في غضون دقائق. اليوم، ما زالت العديد من أجهزة الإنذار تعتمد على حساسات الحرارة أو الدخان التي تتفاعل فقط بعد أن تشتعل النيران بشكل واضح. يصف هذا المقال نظام رؤية حاسوبية جديد قادر على رصد علامات الحريق والدخان في تغذية الكاميرات بشكل شبه فوري، حتى في ظروف صعبة مثل الإضاءة المنخفضة أو الضباب الكثيف. من خلال دمج عدة تقنيات متقدمة في الذكاء الاصطناعي ضمن نموذج واحد، يسعى الباحثون إلى منح رجال الإطفاء ومخططي المدن والهيئات البيئية إشارة مبكرة بكثير—مما قد ينقذ الأرواح والممتلكات والنظم البيئية.

Figure 1
Figure 1.

التحدي المتزايد في اكتشاف اللهب

تُراقَب المدن والغابات الحديثة بشكل متزايد بواسطة الكاميرات، لكن تعليم الحواسيب على التعرف الموثوق على الحريق والدخان في تلك الصور والفيديوهات أمر معقد. تستخدم الأساليب التقليدية شبكات عصبية تعمل جيدًا على الصور الثابتة أو المقاطع القصيرة، لكنها غالبًا ما تعاني في المشاهد الحقيقية المعقدة. قد تُظهر لقطة واحدة شيئًا يشبه الدخان لكنه مجرد ضباب أو عادم. تستطيع الأنظمة المعتمدة على الفيديو تتبّع كيفية تحرك الأشكال مع مرور الوقت، لكنها تميل إلى أن تكون بطيئة ومطالبة بموارد العتاد. ونتيجة لذلك، كثيرًا ما تثير النماذج السابقة إنذارات كاذبة أو تفوت علامات خطر دقيقة وسريعة التغير—خاصة في الإضاءة الضعيفة أو الدخان الكثيف أو الخلفيات المزدحمة.

"مراقب" هجيني للصور والفيديو

يقترح المؤلفون نموذجًا هجينًا يعامل كشف الحريق كمشكلة مكانية وزمانية في آن واحد. بالنسبة للصور الثابتة، يستخدمون نوعًا من الشبكات العصبية يُسمى محول الرؤية، الذي ينظر إلى الصورة كفسيفساء من المناطق ويتعلم كيف ترتبط المناطق البعيدة ببعضها. يساعد ذلك على ملاحظة أنماط واسعة، مثل خيوط الدخان التي تنتشر عبر وادٍ أو لهب منتشر في غابة. بالنسبة للفيديو، يعتمد النظام على شبكة تلافيف ثلاثية الأبعاد تعالج مجموعات من الإطارات دفعة واحدة، مما يلتقط كيف يتغير الدخان والنار مع الزمن. ثم يفحص مُشفّر المحول تلك الأنماط المتغيرة ويركز الانتباه على اللحظات والمناطق الأكثر احتمالًا للدلالة على الخطر، بدلاً من إعطاء وزن متساوٍ لكل إطار.

دمج المؤشرات وموازنة البيانات

خطوة رئيسية في النظام هي طبقة الاندماج التي تمزج الإشارات التفصيلية من الصور الثابتة مع أنماط الحركة من الفيديو. من خلال الجمع بين هذين المنظورين المكملين، يمكن للنموذج تمييز الحرائق الحقيقية من المظاهر الشبيهة غير الضارة مثل وهج الغروب أو الضباب أو السحب. كما أدرك الباحثون أن العديد من مجموعات البيانات العامة تحتوي على أمثلة حريق أكثر بكثير من أمثلة غير الحريق، مما قد يحيد النموذج نحو الإفراط في الإبلاغ عن اللهب. لمواجهة ذلك، أنشأوا مجموعة واسعة من المشاهد غير النارية الواقعية عبر تكبير البيانات بعناية—تغيير السطوع، والقص، وعكس الصور، ومحاكاة حالات مثل الصباح الضبابي أو الأماكن الداخلية الخافتة. ثم درّبوا النموذج بدالة خسارة توازن صراحةً بين الأخطاء في حالات الحريق وغير الحريق، مما حسّن الموثوقية في الاستخدام اليومي.

وضع النظام قيد الاختبار

لمعرفة مدى فعالية نهجهم، اختبر المؤلفون النموذج على مجموعتين شائعتين الاستخدام: مجموعة تقارب ألف صورة ثابتة من تحدي NASA Space Apps، وأخرى من مقاطع فيديو متعلقة بالحريق من Kaggle. بعد المعالجة المسبقة والموازنة، درّبوا وقَيّموا نموذجهم الهجين إلى جانب نماذج أساسية معروفة مثل ResNet وVGG وLSTM وشبكات التلافيف الثلاثية الأبعاد البحتة، وعدة تركيبات هجينة من هذه الطرق القديمة. وصل النظام الجديد إلى حوالي 99.2% دقة على صور NASA و98.3% على مجموعة الفيديو، متفوقًا بوضوح على النماذج التقليدية التي تراوحت عادةً بين منتصف الثمانينيات ومنتصف التسعينيات. كما عمل بسرعة كافية—عشرات المللي ثانية لكل إطار—وبحجم نموذج معتدل، مما يجعله مناسبًا للنشر على أجهزة الحافة مثل وحدات معالجة الرسوم الصغيرة واللوحات المضمنة.

Figure 2
Figure 2.

ماذا يعني هذا لسلامتنا اليومية

بعبارات يومية، تُظهر هذه الدراسة أن ذكاءً اصطناعيًا مصممًا بعناية يمكنه مراقبة تغذية الكاميرات في الوقت الحقيقي والإجابة بثقة على سؤال بسيط لكنه حيوي: «هل هناك حريق أو دخان خطير هنا الآن؟» من خلال الجمع بين السياق البصري الواسع، والحركة عبر الزمن، والانتباه الذكي لأكثر التفاصيل دلالة، يقلل النموذج الهجين بشكل كبير من الحرائق المفقودة والإنذارات الكاذبة. ومع مزيد من الضبط والتعرّض لمشاهد أكثر تنوعًا—مثل المدن الكثيفة، والمساحات تحت الأرض، والطقس القاسي—قد يصبح قاعدة عملية لأنظمة إنذار أذكى، وشبكات مراقبة حرائق الغابات، وأدوات السلامة الصناعية التي تتفاعل أسرع وأكثر دقة من العديد من حلول اليوم.

الاستشهاد: Lilhore, U.K., Sharma, Y.K., Venkatachari, K. et al. Real time fire and smoke detection using vision transformers and spatiotemporal learning. Sci Rep 16, 8928 (2026). https://doi.org/10.1038/s41598-026-36687-9

الكلمات المفتاحية: كشف الحريق, كشف الدخان, رؤية حاسوبية, نماذج المحول, المراقبة في الوقت الحقيقي