Clear Sky Science · ar

شبكة تعزيز إدراكي هجينة خفيفة الوزن لتحسين الدقة للصور تحت الحمراء

· العودة إلى الفهرس

رؤية حرارية أكثر حدة للتقنيات اليومية

تسمح كاميرات الأشعة تحت الحمراء لنا بـ “رؤية” الحرارة في الظلام، عبر الضباب، أو داخل الآلات — لكن الصور التي تنتجها غالبًا ما تكون ضبابية ومنخفضة التفاصيل. تقدم هذه الورقة طريقة جديدة لشحذ تلك الصور الحرارية الضبابية باستخدام الذكاء الاصطناعي، بحيث يمكن لكاميرات المراقبة وأجهزة المسح الطبي وأدوات التفتيش الصناعي الكشف عن معلومات أوضح وأكثر موثوقية دون الحاجة إلى أجهزة أكبر أو أغلى.

Figure 1
الشكل 1.

لماذا من الصعب جعل صور الأشعة تحت الحمراء واضحة

على عكس كاميرات الهواتف الذكية، تلتقط حساسات الأشعة تحت الحمراء إشعاع الحرارة غير المرئي بدلاً من الضوء المرئي. وهذا يجعلها لا تقدر بثمن في الأمن والدفاع والطب ومراقبة المعدات، حيث يمكنها اكتشاف الأشخاص في الليل، أو رصد الالتهابات، أو كشف الأجزاء التي تسخن زائدة. ومع ذلك، عادةً ما تكون حساسات الأشعة تحت الحمراء منخفضة الدقة لأن الكواشف المتقدمة مكلفة وتستهلك طاقة عالية. تحاول طرق برمجية تسمى تحسين الدقة (super-resolution) تحويل صورة خشنة منخفضة الدقة إلى صورة أكثر وضوحًا. الشبكات العصبية التقليدية التي تستخدم الالتفافات جيدة في التقاط الأنماط المحلية مثل الحواف الصغيرة، لكنها تواجه صعوبة في فهم كيف تتعلق أجزاء الصورة المختلفة عبر مسافات بعيدة. الشبكات الأحدث القائمة على المحولات (transformers) يمكنها التقاط هذا السياق الأوسع لكنها ثقيلة وبطيئة وتميل إلى فقدان التفاصيل الدقيقة مثل الخطوط الرفيعة والأنسجة — وهي بالضبط الميزات المهمة للأهداف الصغيرة في مشاهد الأشعة تحت الحمراء.

مزج طريقتين للرؤية

يقترح المؤلفون نموذجًا جديدًا، شبكة تعزيز الإدراك الهجينة (HPEN)، مصممة خصيصًا لموازنة التفاصيل والكفاءة لصور الأشعة تحت الحمراء. كتلتها البنائية المركزية، كتلة تعزيز الإدراك الهجينة، تجمع بين ثلاث أفكار متسلسلة. أولاً، مرحلة «تجميع الرموز» تجمع رقعًا متشابهة عبر الصورة حتى يتمكن النموذج من الاستدلال على المشهد على مستوى عالمي، على نحو يشبه تجميع المناطق ذات الصلة قبل تحديد معناها. ثانيًا، مرحلة «الميزات متعددة المقاييس» تستخدم مسارات معالجة متوازية لمعاينة الهياكل الدقيقة جدًا والجوار الأكبر قليلًا في آن واحد، مما يساعد الشبكة على تتبع الحواف والأنسجة والأشكال الأوسع في نفس الوقت. أخيرًا، مرشح بسيط بحجم 3×3 ينقح وينظف المزايا، مانعًا الآثار الجانبية للتنعيم التي قد تُدخلها العمليات العالمية الكبيرة.

داخل محرك الشحذ الجديد

بالانتقال إلى نظام HPEN الكامل، تبدأ العملية بمعالجة خفيفة للصورة تحت الحمراء منخفضة الدقة لاستخراج الأنماط الأساسية. ثم تُمرر تلك المعلومات عبر سلسلة من الكتل الهجينة، كل واحدة تعمّق فهم النموذج للمشهد من خلال الجمع بين العلاقات بعيدة المدى والتفاصيل الصغيرة النطاق. وصلة اختصار تسمح للمعلومة الخام الأصلية بتجاوز هذه الطبقات العميقة حتى يتمكن النموذج من تركيز جهوده على إعادة بناء المحتوى عالي التردد المفقود — أشياء مثل الحواف الحادة والبقع الساخنة الصغيرة. في المرحلة النهائية، وحدة تكبير مدمجة تعيد مقياس المزايا إلى الدقة المستهدفة، محولة إياها إلى صورة حرارية مشحة بالحجم نفسه كمرجع عالي الجودة. طوال العملية، التصميم مقصود أن يكون خفيف الوزن، محافظًا على عدد العمليات واستهلاك الذاكرة منخفضًا بما يكفي للتشغيل العملي على معالجات الرسوميات الشائعة.

Figure 2
الشكل 2.

مدى فعالية الطريقة في التطبيق العملي

لاختبار HPEN، درّب المؤلفون النموذج وقيّموه على عدة مجموعات بيانات عامة للأشعة تحت الحمراء تشمل مشاهد المدن والنباتات والمركبات والمشاة وظروف الليل. قارنوه بالعديد من طرق تحسين الدقة «خفيفة الوزن» الحديثة التي تهدف إلى الدقة والكفاءة معًا. طابق HPEN باستمرار هذه النظائر أو تفوّق عليها قليلًا في مقاييس الجودة القياسية التي تقيس مدى قرب الصورة المشحذة من مرجع عالي الدقة. كان قويًا بشكل خاص في سيناريو التكبير بمقدار أربعة أضعاف، حيث يكشف تحويل صورة صغيرة جدًا إلى أكبر كثيرًا عن العيوب عادةً. بالرغم من هذه الدقة، استخدم HPEN عمليات أقل بكثير، وذاكرة بطاقة رسومات أقل بكثير، ووفّر زمن معالجة أسرع من المنافسين الأقوياء القائمين على المحولات. أظهرت اختبارات إضافية تقيس الجودة المدركة شبيهة بالبشر أن نتائج HPEN بدت الأقرب إلى صور الأشعة تحت الحمراء عالية الدقة الحقيقية، مع حواف أقل بهتانًا وأنسجة محفوظة بشكل أفضل.

ماذا يعني هذا للاستخدامات العملية

بالنسبة لغير المتخصص، الرسالة الأساسية هي أن HPEN يقدم طريقة أذكى لـ «تعزيز التكبير» على الكاميرات الحرارية دون تغيير الأجهزة. من خلال الجمع بعناية بين السياق العالمي (فهم المشهد ككل) والتفاصيل المحلية (الحفاظ على الحواف والأنسجة الدقيقة) في حزمة فعالة، تنتج الطريقة صورًا تحت حمراء أوضح وأكثر معلوماتية مع إبقاء تكاليف الحوسبة تحت السيطرة. قد يساعد ذلك أنظمة المراقبة على تمييز الأشخاص أو المركبات بوضوح أكبر في الظلام، ويسمح لفرق التفتيش الصناعية برؤية الشقوق الدقيقة أو البقع الساخنة على المعدات، ويمنح الأطباء أنماطًا حرارية أوضح أثناء الفحص غير الغازي — كل ذلك باستخدام حساسات موجودة ترى فجأة أكثر مما كانت تراه من قبل.

الاستشهاد: Liu, Z., Tian, J., Liu, C. et al. A lightweight hybrid perception enhancement network for infrared image super-resolution. Sci Rep 16, 6572 (2026). https://doi.org/10.1038/s41598-026-37763-w

الكلمات المفتاحية: التصوير بالأشعة تحت الحمراء, تحسين الدقة, التعلّم العميق, تحسين الصور, رؤية الحاسوب