Clear Sky Science · ar
شبكة تحويلية بيانية لشبكة Q للحكم التعاوني واتخاذ القرار اللامركزي في شبكات التقاطعات المتعددة
لماذا تهم إشارات المرور الأذكى
كل من يقود في المدينة يعرف إحباط المرور عبر إشارة تلو الأخرى، حتى عندما يبدو الطريق خالياً. موجات التوقف والانطلاق هذه هي أكثر من مجرد إزعاج: فهي تضيع الوقت، تهدر الوقود، ويمكن أن تتسبب في شلل ممرات كاملة عندما تمتد الطوابير عبر عدة تقاطعات. تستكشف هذه الدراسة نهجاً جديداً لجعل إشارات المرور "تتحدث" مع بعضها بحيث تتشكل موجات خضراء بشكل أكثر موثوقية على امتدادات طويلة من الطريق، حتى عندما تكون حركة المرور غير متوقعة وشبكة الشوارع كبيرة ومعقدة.

كيف تصبح شوارع المدينة شبكة
يبدأ الباحثون بمعاملة نظام الطرق الحضرية كشبكة من النقاط الموصولة. كل تقاطع هو عقدة وكل طريق بينهما هو رابط. يرى كل متحكم إشارة فقط ما تبلغ به الحساسات المحلية: عدد السيارات المنتظرة، مدة تأخرها، وأي طور هو الأخضر حالياً. لا يمتلك أي متحكم صورة كاملة للمدينة دفعة واحدة، ومع ذلك فإن كل تغيير في الضوء يؤثر على حركة المرور التي ستصل إلى تقاطعات أخرى لاحقاً. التحدي هو تمكين هؤلاء المتحكمين المحليين من التعاون بحيث يمكن للمركبات أن تسير على طول ممر بأقل قدر ممكن من التوقفات غير الضرورية، مع الحفاظ على خدمة الشوارع الجانبية وحركة الانعطاف.
تعليم الأضواء على التعاون خطوة بخطوة
بدلاً من خطط التوقيت المصممة يدوياً، يستخدم المؤلفون التعلم المعزز، حيث يتعلم خوارزم عن طريق تجربة الإجراءات في محاكي حركة المرور وملاحظة النتائج. يتصرف كل تقاطع كوكيل يختار أي طور يعرضه تالياً ولأي مدة. الابتكار الرئيسي هو طريقة تسمى شبكة Q المحول البياني، أو GTQN، التي تقرر أي التقاطعات المجاورة هي الأهم في كل لحظة. تفعل ذلك على مرحلتين: تختار أولاً مجموعة صغيرة من الجيران المؤثرين صعوداً أو هبوطاً في الممر، ثم تمنح كل واحد منهم درجة تأثير بناءً على حالة المرور الحالية. هذا يمنع المتحكم من أن يغمره معلومات ضوضائية من العقد البعيدة التي لها تأثير ضئيل على مروره الخاص.

متابعة المرور عبر المكان والزمان
لتشكيل موجة خضراء سلسة، تحتاج الإشارة إلى توقع المركبات التي انطلقت من عدة تقاطعات بعيدة وقد تستغرق ثوانٍ عديدة للوصول. يعالج GTQN هذا بدمج معلومات حول تخطيط الشبكة مع سجل لتغيرات الحالة عبر الزمن. تُستخدم وحدة محول، اشتهرت أصلاً في نماذج اللغة، للنظر إلى الوراء عبر التاريخ القريب عند كل تقاطع واختيار اللحظات الماضية التي تهم القرار الحالي. في الوقت نفسه، يستنتج نموذج بياني العلاقات بين التقاطعات. من خلال دمج المكان والزمان في نموذج واحد، يمكن للنظام أن يتعلم كيف تتحرك مجموعات المركبات على طول الممر وكيفية مواءمة الإشارات الخضراء مع وصولها على أفضل نحو.
تحديد أهداف تتجاوز زاوية واحدة
لو أن كل إشارة ضوء حاولت فقط تفريغ طابورها الخاص، فقد تؤدي الشبكة بأكملها أداءً ضعيفاً. على سبيل المثال، قد يختصر إشارة في أسفل المجرى طوراً أخضراً كان سيسمح لمجموعة من السيارات القادمة من أعلى المجرى بالمرور دون توقف. لتجنب ذلك، يصمم المؤلفون هدفاً ثنائياً المستويات. لا يزال كل تقاطع يُكافأ لتقليل طوابيره وأوقات الانتظار الخاصة به، لكن إشارة تدريب مركزية أيضاً تعاقب على التوقفات الإضافية التي تعانيها المركبات المسافرة على طول الممر الرئيسي بعد إطلاقها من نقطة الدخول. أثناء التدريب، يستخدم موديل "الحوكمة" المركزي هذه النتيجة على مستوى الممر لتوجيه التعلم. بعد التدريب، تعمل المتحكمات المتعلمة محلياً وتشارك رسائل متناثرة وموجهة فقط مع جيرانها المحددين.
ما أظهرته المحاكاة
يختبر الفريق GTQN في محاكاة مفصلة لكل من الشبكات الشبكية الاصطناعية وشبكة لمدينة حقيقية من تشنغدو، الصين، بما في ذلك نظام يضم 100 تقاطع. بالمقارنة مع عدة طرق متقدمة للتحكم متعدد الوكلاء، يقلل GTQN من عدد المرات التي تضطر فيها المركبات للتوقف، ويقصر أوقات الانتظار، ويمنع نمو الطوابير إلى طول يكفي لحجب التقاطعات الأعلى تدفقاً. كما يحافظ على أداء معقول عندما تتأخر بعض الرسائل بين التقاطعات أو تُفقد، وهي خاصية مهمة لشبكات الاتصال الحقيقية. تُظهر دراسات الإلغاء المتأنية أن كل عنصر من عناصر التصميم له دور: الندرة المتعلمة، النموذج المدمج للمكان والزمان، وإشارة التدريب المركزية كلها تسهم في تنسيق قوي.
ماذا يعني هذا للسفر اليومي
بالنسبة للسائقين وراكبي الدراجات وركاب الحافلات، الفكرة وراء هذا العمل بسيطة: بدلاً من أن تعمل كل إشارة مرور بمعزل، تتعلم الإشارات على طول الممر أن تتوقع بعضها وتحمي حركة مجموعات المركبات. في محاكاة عالية الدقة، يؤدي ذلك إلى توقفات أقل، وطوابير أقصر، وسرعات سفر أكثر ثباتاً على الطرق المزدحمة. بينما تزال الدراسة محدودة ببيئة افتراضية ولا تتعامل بعد مع المشاة أو أولوية وسائل النقل العام أو كل خصائص الأجهزة الحقيقية، فإنها توضح أن التعاون المصمم بعناية بين العديد من المتحكمين المحليين يمكن أن يحول سلسلة فوضوية من الإشارات الحمراء إلى رحلة أكثر قابلية للتنبؤ وكفاءة.
الاستشهاد: Zhang, H. Graph transformer Q-network for collaborative governance and decentralized decision-making in multi-intersection networks. Sci Rep 16, 15549 (2026). https://doi.org/10.1038/s41598-026-45895-2
الكلمات المفتاحية: التحكم في إشارات المرور, التعلم المعزز متعدد العملاء, المحول البياني, تتابع الممر, النقل الذكي