Clear Sky Science · ar

مجموعة بيانات لتحليل فيديو المرور من عدة منظورات

2026-02-26 · العودة إلى الفهرس

لماذا تهم كثرة العيون في الشارع

كل من حاول عبور شارع مزدحم يعرف أن السيارات والدراجات والمشاة يتحركون بطرق قد يصعب التنبؤ بها. تتجه المدن إلى الكاميرات والذكاء الاصطناعي للحفاظ على سلامة هذه المساحات، لكن معظم الأنظمة ما زالت تنظر إلى الطريق من زاوية واحدة فقط. تقدم هذه الورقة مجموعة فيديو عامة جديدة تراقب نفس ممر المشاة من ثلاث زوايا مختلفة في آن واحد، مما يمنح الباحثين المادة الخام الغنية اللازمة لبناء أنظمة مرورية أكثر أمانًا وذكاءً.

ممر مشاة واحد، ثلاث طرق للرؤية

تركز مجموعة البيانات على مشهد يومي واحد: ممر مشاة في حرم جامعة مورسيا بإسبانيا. بدلاً من الاعتماد على كاميرا واحدة، سجل المؤلفون كل حدث بثلاثة أجهزة تعمل في وقت واحد: كاميرا مثبتة على سيارة متحركة تقترب من الممر، وكاميرا ثابتة على عمود جانب الطريق في موقع مرتفع، وكاميرا على طائرة بدون طيار صغيرة تحوم فوق المكان. تلتقط هذه المشاهد معًا نفس الأشخاص والمركبات من مستوى الأرض، ومن الجانب، ومن السماء، مما يعكس إلى حد بعيد كيف قد يرى مراقبون مختلفون نفس اللحظة في الحياة الواقعية.

التقاط المشي الروتيني والحوادث النادرة معًا

لجعل البيانات مفيدة لكل من المراقبة اليومية وحالات الطوارئ، نظم الفريق نوعين من الأحداث. في بعض التسجيلات، يعبر المشاة ببساطة بينما تتوقف السيارة وتنتظر، مما يعكس سلوك المرور العادي. في تسجيلات أخرى، يمثل ممثل سقوطًا أثناء وجوده في الممر، متبعًا أنماط حركة مصممة لتشبه حادثًا حقيقيًا. تتبع السيارة دائمًا نفس المسار، ويكرر المشاة نفس الحركات الأساسية، بحيث يمكن للباحثين مقارنة كيفية ظهور كل سيناريو من الكاميرات المختلفة ودراسة كيف تبرز الأحداث غير العادية مقارنة بالروتينية.

من اللقطات الخام إلى وقود بحثي قوي

ميزة أساسية في مجموعة البيانات هي أن ملفات الفيديو تُحفظ خامًا وغير محررة. المعالجة الوحيدة هي إضافة طوابع زمنية دقيقة، بالإضافة إلى إشارة بصرية بسيطة: في بداية كل عبور، يرفع أحد المشاة اليد لفترة وجيزة. هذا يجعل من السهل محاذاة الإطارات من جميع الكاميرات بحيث يمكن دراسة نفس اللحظة الزمنية من كل زاوية. تغطي ملفات الفيديو الـ18 ثلاث إعدادات للكاميرات وحالتين للعبور (مع سقوط وبدون سقوط) عبر ثلاث ترتيبات مكانية مختلفة للسيارة ووحدة الطريق والطائرة. كما يتلقى الباحثون صورًا إضافية تصف الخصائص البصرية الدقيقة لعدسة كاميرا الطريق، مما يساعدهم على تصحيح التشويه عند الحاجة.

اختبار مدى فهم الآلات للمشهد

للتحقق من أن مجموعة البيانات مفيدة حقًا، أجرى المؤلفون اختبارات كشف كائنات قياسية، وقارنوا تسجيلاتهم مع مجموعات فيديو مرورية معروفة مثل KITTI وVisDrone وUA-DETRAC. استخدموا نماذج كشف حديثة لتحديد الأشخاص في الفيديو وقاسوا مدى دقة مطابقة الأشكال المتوقعة مع المخططات التي تحقق منها البشر. في المتوسط، نتج عن مجموعة البيانات الجديدة درجات أعلى لكل من دقة الاكتشاف ومحاذاة أشكال الاحتواء. من خلال فحص عدد المرات التي كان فيها كل شخص مرئيًا في عرض واحد أو اثنين أو في كل العروض الثلاثة، أظهر الفريق أيضًا أن التغطية المتداخلة من الكاميرات المختلفة تقلل كثيرًا من النقاط العمياء عندما يكون الأشخاص مخفيين خلف سيارات أو أثاث الشارع.

ما الذي يعنيه هذا لشوارع المستقبل

بالنسبة لغير المتخصصين، الرسالة الأساسية هي أن هذه المجموعة تقدم صورة أكثر اكتمالًا عما يحدث عند ممر المشاة مقارنةً بالمجموعات السابقة. من خلال دمج مشاهد السيارة والطريق والجوية بطريقة متزامنة، تمنح المهندسين والعلماء بيئة اختبار واقعية لبناء أنظمة مرورية قادرة على تتبع الأشخاص بمزيد من الاعتمادية، واكتشاف الحوادث بسرعة، والتعامل مع تعقيدات العالم الحقيقي مثل العوائق وتغير نقاط الرؤية. على المدى الطويل، يمكن لموارد مثل هذه أن تساعد في تمكين معابر أكثر أمانًا، وإشارات مرورية أكثر استجابة، وخدمات مدنية أذكى تحمي كل من يستخدم الطريق بشكل أفضل.

الاستشهاد: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

الكلمات المفتاحية: مراقبة المرور, فيديو متعدد المشاهد, سلامة المشاة, المدن الذكية, مجموعة بيانات رؤية حاسوبية