Clear Sky Science · ar
نموذج رؤية-لغة موجه حسب المجال للنقل المستدام للشحن مع تصنيف ناقل الحركة لشاحنات الدريّج والحِمل
موانئ أنظف، وشاحنات أذكى
تنقل الموانئ البضائع التي تملأ رفوف متاجرنا، لكن الشاحنات القصيرة المسافة التي تقل الحاويات داخل المحطات وخارجها تمثّل أيضًا مصادر تلوث كبيرة. تُظهر هذه الدراسة كيف يمكن لنوع جديد من الذكاء الاصطناعي مراقبة شاحنات «الدريّج» بكاميرات على جانب الطريق وتحديد تلقائيًا أيها لا يزال يعمل بالديزل وأيها يستخدم تقنيات أنظف—دون الحاجة إلى وضع تسميات يدوية للصور. يمكن أن تساعد هذه الرؤى المؤتمتة الجهات الرقابية والمخطِّطين والمجتمعات المحلية على تتبع التقدم نحو هواء أنظف حول بعض أكثر الموانئ ازدحامًا في العالم.
لماذا تهم شاحنات الموانئ للمناخ والصحة
في الولايات المتحدة، يشكل قطاع النقل أكبر مصدر منفرد لانبعاثات غازات الاحتباس الحراري، وتلعب الشاحنات الثقيلة دورًا أكبر من حجمها: فهي نسبة صغيرة من المركبات لكنها تنتج حصة كبيرة من الانبعاثات. ولا يبرز هذا الأمر أكثر من حول مينائي لوس أنجلوس ولونغ بيتش، وهما ميناءان متجاوران يتعاملان مع نحو 40 بالمئة من واردات الحاويات الأمريكية، ويشكلان أيضًا أكبر مصدر ثابت لتلوث الهواء في جنوب كاليفورنيا. تنتج شاحنات الدريّج—الرافعات التي تنقل الحاويات بين الموانئ وساحات السكك والأنظمة اللوجستية—جزءًا كبيرًا من هذا التلوث رغم كون مساراتها قصيرة ومتوقعة. لذلك أصدرت كاليفورنيا أمرًا يقضي بأنه بحلول عام 2035 يجب أن تكون كل شاحنات دريّج الموانئ خالية من الانبعاثات، بالاعتماد على البطاريات الكهربائية أو خلايا الوقود الهيدروجينية أو تقنيات الغاز الأنظف بدلًا من الديزل التقليدي.

رؤية ما يُشغِّل الشاحنة وما تحمله
لمعرفة ما إذا كانت هذه السياسات تعمل، يحتاج المسؤولون إلى قياس أنواع الشاحنات التي تظهر فعليًا عند بوابات الموانئ والطرق: هل تعمل بالديزل أم بالكهرباء؟ هل تنقل حاوية ممتلئة أم هي هيكل فارغ أم لا توجد مقطورة على الإطلاق؟ تقليديًا، يتطلب الإجابة على مثل هذه الأسئلة بناء مجموعات ضخمة من الصور ذات تسميات يدوية وتدريب نماذج خاصة بالمهمة. يقترح المؤلفون مسارًا مختلفًا يسمونه ZeroDray، والذي يستخدم نموذج رؤية-لغة—نظام ذكاء اصطناعي يمكنه فهم الصور والنص معًا—من دون تدريب إضافي. يُقدَّم للنموذج صورًا من كاميرات على جانب الطريق لشاحنات مارّة على ممر يخدم موانئ لوس أنجلوس ولونغ بيتش، ويجب أن يصنِّف كلًا من نظام الدفع (ديزل، كهربائي، غاز طبيعي مضغوط، أو هيدروجين) وترتيب الحمولة (حاوية 20 قدمًا مفردة، ما يعادل 40 قدمًا الأطول، شاسيه فارغ، أو شاحنة بوبتايل بدون مقطورة).
تعليم الذكاء الاصطناعي ليفكّر مثل خبير شاحنات
كونه جاهزًا للاستخدام، تكون نماذج الرؤية-اللغة عامة: تعرف شيئًا عن كل شيء من الإنترنت لكنها تفتقر لمعرفة عميقة في مواضيع متخصصة مثل دريّج الشاحنات. يجسر ZeroDray هذه الفجوة عبر تزويد النموذج بمطالبات مُصاغة بعناية تُشفِّر تلميحات خبراء. بالنسبة لأنظمة الدفع، تصف المطالبات دلائل بصرية مثل أعمدة العادم وخزانات الوقود الكبيرة للديزل، وخزانات أسطوانية للغاز الطبيعي المضغوط، وخزانات هيدروجين لشاحنات خلايا الوقود، أو غياب معدات العادم وشعارات المركبات الكهربائية للآلات الكهربائية. بالنسبة للحمولة، تُوجِّه المطالبات النموذج ليفكِّر في هندسة المشهد: هل يتجاوز طول الحاوية الارتفاع وطول الكبينة بشكل ملحوظ، كما في حمولة طويلة بطول 40 قدمًا، أم أنه أقرب في الحجم، كما في حاوية أقصر بطول 20 قدمًا؟ من خلال مطالبة الذكاء الاصطناعي بطرح هذه الإشارات خطوة بخطوة وشرح استدلاله بلغة بسيطة، يجعل الإطار قراراته أكثر شفافية وأسهل للتحقق.

اختبار النظام على حركة الموانئ الحقيقية
قام الباحثون بتقييم ZeroDray على 443 صورة للشاحنات التقطتها كاميرا ثابتة على جانب الطريق قرب الموانئ خلال يومين في فبراير 2025. قدّم المراقبون البشريون تسميات أرضية لكل نظام دفع وترتيب حمولة لكل شاحنة. ثم قارنوا ZeroDray بإعداد أبسط قدم أسماء فئات فقط إلى نفس النموذج الأساسي. مع إرشاد بسيط، استطاع النظام الأساسي التعرف على بعض الحالات الواضحة بالفعل، مثل شاحنات الديزل بدون مقطورة. لكنه واجه صعوبات كبيرة عندما كانت الفروق تعتمد على اختلافات بصرية طفيفة أو على التوزيع المكاني، فكان يخلط في كثير من الأحيان بين الجرارات العاملة بالديزل والكهرباء أو يخطئ بين الحاويات القصيرة والطويلة. بعد إضافة دلائل بصرية مستندة إلى خبراء وقواعد مكانية، قفزت الدقة بشكل كبير. وصلت دقة تصنيف نظام الدفع إلى نحو 100 بالمئة عبر فئات الديزل والكهرباء والهيدروجين والغاز الطبيعي المضغوط. تحسّن تمييز الحمولة، خاصة الفارق الحساس بين أطوال الحاويات المفردة ومكافئ الطول المزدوج، من نحو نصف الحالات الصحيحة إلى ما يقرب من 98 بالمئة. إجمالًا، عبر 11 فئة مجمعة من نظام الدفع والحمولة، حقق إطار ZeroDray المحسّن متوسط درجة F1 يبلغ 99 بالمئة، متفوقًا بكثير على النهج الأساسي.
ماذا يعني هذا لممرات الشحن الأنظف
للغير متخصصين، الخلاصة هي أن ذكاءً اصطناعيًا عامًا، عندما يُوجَّه بالإشارات الخبيرة المناسبة، يمكنه أن «ينظر» إلى فيديوهات الطرق السريعة ويحدّد ليس فقط كيف تُحمَّل الشاحنات بل وما الذي يُشغِّلها—دون أي تدريب مخصص مكلف. يمكن أن يزوّد هذا الإمكان السلطات المينائية والجهات الرقابية بأداة قوية لمراقبة الانتقال من الديزل إلى شاحنات الدريّج الخالية من الانبعاثات، وتحديد الأماكن التي تحتاج محطات شحن أو هيدروجين جديدة، وتقليل الرحلات الفارغة المهدرة. بينما استخدمت الدراسة الحالية مجموعة بيانات متواضعة من كاميرا واحدة وتحت ظروف مثالية، يجادل المؤلفون بأن الاستراتيجية نفسها يمكن توسيعها لتشمل مراكز شحن أخرى وبيئات أكثر تنوعًا. إذا نُفِّذت على نطاق واسع بمسؤولية، يمكن لأنظمة مثل ZeroDray أن تجعل تفاصيل نشاط الشحن غير المرئية ظاهرة، مما يساعد المجتمعات وصانعي السياسات على دفع ممرات الشحن نحو تشغيل أنظف وأكثر كفاءة.
الاستشهاد: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4
الكلمات المفتاحية: شاحنات خالية من الانبعاثات, نماذج رؤية-لغة, دريّج الموانئ, انبعاثات الشحن, نقل مستدام