Clear Sky Science · ar

مراقبة المحيط الزراعي وتحديد الأجسام بناءً على إعدادات محسّنة لـ You Only Look Once وكاشف Single Shot Multibox باستخدام صور مرئية وحرارية مجمعة

· العودة إلى الفهرس

عيون أذكى لماكينات المزرعة الأكثر أمانًا

تزداد أحجام الجرارات والحصادات الحديثة وسرعتها وأتمتتها، مما يثير سؤالًا بسيطًا لكنه خطير: كيف نضمن ألّا تصطدم بالأشخاص أو الحيوانات أو الآلات المخفية في الغبار أو الضباب أو الظلام؟ تصف هذه الورقة نظام سلامة عملي يمنح معدات المزرعة نوعًا من «الرؤية الفائقة» عبر دمج كاميرات الفيديو العادية وكاميرات استشعار الحرارة، ثم تقارن بين إعدادات مختلفة للذكاء الاصطناعي لمعرفة أيها يستطيع اكتشاف المخاطر بدقة وسرعة أكبر.

لماذا يحتاج العمل الزراعي إلى رؤية أفضل

باتت الزراعة تعتمد بدرجة كبيرة على آلات كبيرة وقوية تعمل لساعات طويلة، غالبًا ليلاً أو في طقس سيئ. يمكن لكاميرا الفيديو الأساسية أن تساعد السائق على الرؤية حول الجرار، لكن الصور العادية تفشل عند وجود ضباب أو مطر أو وهج شديد أو ظلام. تعمل الكاميرات الحرارية — التي تلتقط الحرارة بدلًا من الضوء — جيدًا في تلك الظروف القاسية وتبرز الأجسام الدافئة مثل البشر والحيوانات عن الخلفية. يرى المؤلفون أن الجمع بين نوعي الصور هو أفضل طريقة لبناء نظام إنذار ميسور التكلفة يمكن تركيبه لاحقًا على الآلات الحالية ودمجه مع لوحات تحكم الجرارات القياسية.

كيف تعمل الأنظمة الثنائية والموحدة

ركّب الفريق وحدة كاميرا مجمعة تحتوي على RGB (ألوان عادية) وكاميرا حرارية فوق سقف الجرار وأرسل تدفّقي الصور إلى وحدة معالجة منخفضة التكلفة داخل الكابينة. استكشفوا طريقتين رئيسيتين لاستخدام الذكاء الاصطناعي في اكتشاف الأجسام بهذه الصور. في النهج الأول «ثنائي الشبكة»، تم تدريب شبكة عصبية واحدة على الصور العادية فقط وشبكة ثانية على الصور الحرارية فقط؛ ثم تم دمج نتائجهما. في النهج الثاني «الموحَّد»، تم ضبط الصورتين بعناية، ودمجهما فوق بعضهما وتمريرهما إلى شبكة واحدة تتعلم من النوعين في آنٍ واحد. تم تنفيذ كلا التصميمين باستخدام عائلة نماذج الكشف السريعة المعروفة باسم YOLOv8 وباستخدام تصميم بديل يسمى SSD، مكيَّف لأجهزة مضمنة صغيرة.

Figure 1
الشكل 1.

بناء وتدريب رؤية الآلة للحقل

لتعليم هذه الشبكات ما الذي يجب أن تبحث عنه، جمع الباحثون مجموعة بيانات كبيرة من مكتبات صور عامة وتسجيلات كاميراتهم الخاصة. شملت الصور البشر والحيوانات البرية والاهلية والجرارات والحصادات والشاحنات والحافلات وآلات مزرعة أخرى، في كلٍّ من العرض المرئي والحراري. أحاطوا بكل جسم بمستطيل مرسوم يدويًا ووضعوا تسميات، ثم ضاعفوا الصور — قلبًا، تدويرًا أو طمسًا بسيطًا — لمحاكاة التنوع المرئي في الحقول الحقيقية. قُسمت البيانات إلى مجموعات تدريب وتحقق واختبار حتى تتعلّم الشبكات على جزء منها وتُقيَّم بعدل على صور لم ترها من قبل. أُولِيَ عناية خاصة لقياس ليس فقط الدقة الخام، بل أيضًا عدد العمليات الحسابية ومعدل الإطارات في الثانية الذي تحتاجه كل نموذج، لأن أي نظام فعلي على الجرار يجب أن يعمل بسرعة وموثوقية في الحقل.

أي العيون الرقمية أداءها الأفضل؟

على آلاف الصور الاختبارية، اكتشفت جميع إعدادات YOLOv8 معظم الأهداف جيدًا جدًا، خصوصًا الآلات الزراعية الكبيرة والحيوانات ذات الأجسام الدافئة. النموذج الموحد الذي استوعب بيانات RGB والحراري في مسار واحد وصل إلى نتيجة إجمالية (متوسط الدقة) بنحو 0.90، متقدمًا قليلًا على إعداد الشبكتين المزدوجة الذي حقق 0.88. بعبارة أخرى، منح دمج نوعي الرؤية داخل شبكة واحدة دفعة صغيرة لكنها حقيقية في الأداء دون زيادة تعقيد التشغيل. ظهرت أكبر التحسّنات من التصوير الحراري بالنسبة للبشر والحيوانات في الإضاءة الضعيفة، بينما بقيت الصور العادية أفضل في الكشف عن الأشكال التفصيلية مثل الجرارات. عندما استبدل الفريق YOLOv8 بنموذج SSD المبسّط، تراجع الأداء بشكل ملحوظ لمعظم الفئات، رغم أن SSD تدرب أسرع بكثير. قدّم YOLOv8، وخصوصًا نسخته الأصغر "Nano"، دقة أعلى مع تحقيق سرعات زمنية فعلية تقارب 27 إطارًا في الثانية على أجهزة متواضعة.

Figure 2
الشكل 2.

تحويل اكتشافات الذكاء الاصطناعي إلى تحذيرات بسيطة

بدلًا من إرباك السائق بتدفقات الفيديو، يحوّل النظام الاكتشافات إلى واجهة لوحة مبسطة تتبع معيار اتصال الجرار الشائع (ISOBUS). على لوحة خضراء بسيطة، تعرض أيقونات ما إذا كان هناك إنسان أو حيوان أو مركبة أمام الآلة، مع معلومات عن المسافة والاتجاه ومدى ثقة النظام. يمكن لهذه الواجهة المقتضبة العمل على طرفيات المشغل الحالية وصُممت لتحمل ظروف الحقل القاسية، مع كاميرات محمية، وركيبات مثبتة ومثبتة، وتخطيط للتحكم بالغبار ودرجات الحرارة في الإصدارات المستقبلية.

ماذا يعني هذا للزراعة اليومية

لغير المتخصصين، الخلاصة أن منح الجرارات "نوعين من العيون" ودماغ ذكاء اصطناعي مُختار بعناية يمكن أن يحسّن السلامة بشكل كبير دون الحاجة لأجهزة غريبة الثمن. تقدم شبكة YOLOv8 واحدة مضاهاة ومضبوطة تمزج الرؤيتين العادية والحرارية أفضل مزيج من الدقة والسرعة والبساطة بين الخيارات المختبرة، متفوقة بوضوح على تصميم SSD. ومع أن النظام لا يزال يواجه صعوبات إلى حد ما في التعرف على البشر في جميع الحالات — جزئيًا لأن أمثلة البشر كانت أقل في بيانات التدريب — تُظهر الدراسة أن أنظمة التحذير القائمة على الكاميرا للمعدات الزراعية عملية وقابلة للتطبيق ومقتربة من الجاهزية الميدانية. مع بيانات أكثر توازناً وطرق دمج محكمة، يمكن للإصدارات المستقبلية أن تساعد في منع الحوادث وحماية الحياة البرية وجعل الزراعة واسعة النطاق أكثر أمانًا للجميع داخل الحقل وحوله.

الاستشهاد: Tarasiuk, K., Mystkowski, A., Ostaszewski, M. et al. Agriculture surrounding monitoring and object identification based on optimized you only look once and single shot multibox detector setups using combined vision and thermal images. Sci Rep 16, 5129 (2026). https://doi.org/10.1038/s41598-026-36181-2

الكلمات المفتاحية: سلامة الزراعة, التصوير الحراري, رؤية حاسوبية, كشف الأجسام, YOLOv8