Clear Sky Science · ar
حارس للمتتبِّع متعدد الأجسام الواعي بالثقة
متابعة العديد من الأشياء في وقت واحد
من السيارات الذاتية القيادة والروبوتات المخصصة للتوصيل إلى كاميرات المراقبة الذكية ونقل المناسبات الرياضية، باتت الأجهزة الحديثة بحاجة متزايدة لتتبُّع عدة أشخاص أو أشياء في الوقت نفسه. ومع ذلك، فإن الواقع فوضوي: الحشود تحجب الرؤية، والكاميرات تهتز فتتسبب في ضبابية، وكاشفات الأشياء قد لا تكون متأكدة ما إذا كانت البقعة الخافتة شخصًا أم مجرد خلفية. تعرض هذه الورقة "حارس"، طريقة جديدة لتمكين الحواسيب من تتبُّع العديد من الأجسام المتحركة بمزيد من الاعتمادية عن طريق التفكير الصريح في عدم اليقين—مدى تأكد النظام أو عدم تأكده مما يراه.
لماذا التتبُّع في العالم الحقيقي صعب
تعمل أنظمة التتبُّع المتعدد عادة على خطوتين. أولاً، تكشف عن الأجسام في كل إطار فيديو. ثانيًا، تربط هذه الاكتشافات عبر الزمن لتكوِّن مسارات مستمرة لكل فرد. تميل الأنظمة الحالية إلى الوثوق فقط بالاكتشافات الأكثر ثقة، وتستبعد الضعيفة لتجنُّب الإنذارات الكاذبة. هذا يساعد على الدقة لكنه يضر الاسترجاع: في حالات الضبابية الحركية أو الانسداد الجزئي، يظهر كثير من الأشخاص بشكل ضعيف فيُهملون. في الوقت نفسه، غالبًا ما يقوم المتتبِّعون التقليديون بحذف المسار بعد أن يختفي لعدد ثابت من الإطارات. تفشل هذه قاعدة العمر في الحشود الحقيقية، حيث قد يختفي شخص خلف آخر لفترة ثم يعاود الظهور، فيُقطَّع مساره وتُعاد تخصيص هويته.

متتبِّع يعرف متى هو واثق أو غير واثق
يتعامل حارس مع المشكلتين عن طريق اعتبار كل مسار أنه يمتلك مستوى ثقة متغيرًا مع الزمن. جزء من النظام، يُسمَّى الربط الواعي بالثقة، ينظر إلى عدد المرات التي تم فيها مطابقة المسار بنجاح، وعدد مرات الفشل مؤخرًا، وقوة اكتشافاته الأخيرة. استنادًا إلى هذا التاريخ، يصنِّف كل مسار إلى واثق أو غير واثق أو معرض للخطر. بالنسبة للمسارات الواثقة، التي يتوقَّع حركتها بشكل جيد، يعتمد حارس اعتمادًا كبيرًا على المكان المتوقع للشخص ويولي اهتمامًا أقل بالمظهر البصري. يساعد ذلك على تجنُّب خلط الأشخاص الذين يبدون متشابهين لكن يقفون في أماكن مختلفة. أما بالنسبة للمسارات المعرضة للخطر، التي ربما خرجت لتوها من انسداد أو تحمل تنبؤات مهتزة، فيفعل النظام العكس: يوسِّع منطقة البحث ويعتمد أكثر على مظهر الشخص بدلًا من المكان الذي يقول نموذج الحركة البسيط أنه يجب أن يكون فيه.
منح المسارات المختفية فرصة ثانية
يتدخل المكوِّن الثاني، المسمى آلية تعزيز البقاء، عندما يصبح المسار مهددًا بالاختفاء. بدلًا من حذف المسار فورًا بعد عدد ثابت من الإطارات المفقودة، يحتفظ حارس بـ"درجة بقاء" تنمو مع استمرار عدم مطابقة المسار. مع تزايد الخطر، يبحث النظام بنشاط بين الاكتشافات منخفضة الثقة—الإشارات التي لا يكون الكاشف واثقًا منها—لإيجاد مرشحين محتملين قد يكونون نفس الشخص. يقوم بضبط مدى ثقته في الموقع والمظهر وحدود الحركة الفيزيائية بشكل تدريجي، مما يسمح بمزيد من الخطأ الموضعي مع مطلب مظهر متسق وحركة واقعية. عندما يمر اكتشاف ضعيف لكنه معقول بهذه الفحوص، يعزِّز حارس مؤقتًا ثقته الداخلية حتى يتمكن من المنافسة مع الاكتشافات الأقوى في خطوة المطابقة الرئيسية، مما يمنح المسار الأصلي فرصة للاستمرار بدلًا من أن يُستبدل.

اختبار حارس
اختبر المؤلفون حارس على ثلاث مجموعات معيارية صعبة. تغطي مجموعة MOT17 مشاهد شارع متنوعة مع مشاة، وتركز MOT20 على حالات اكتظاظ شديد مع انسدادات كبيرة، ويتابع DanceTrack راقصين يتحركون بطرق غير خطية وغير متوقعة وغالبًا ما يرتدون أزياء متشابهة. عبر هذه المجموعات، حسَّن حارس باستمرار مقاييس تركز على الحفاظ على هوية كل شخص عبر الزمن، مثل مقياس F1 للتعرّف ودقة التتبُّع من الرتبة الأعلى. كما قلل عدد تبدلات الهوية وتجزؤ المسارات مقارنة بالمتتبِّعين المعروفين الذين إما يعاملون كل الاكتشافات بنفس الطريقة أو ينهون المسارات بشكل سلبي. وعلى الرغم من أن حارس يضيف بعض الحسابات الإضافية وقد يولِّد عددًا قليلًا من الإيجابيات الكاذبة أكثر عندما يعتمد على الاكتشافات الضعيفة، فإنه يظل سريعًا بما يكفي للاستخدام في الزمن الحقيقي في معظم السيناريوهات.
ما معنى هذا للتقنية اليومية
بعبارة بسيطة، يجعل حارس أنظمة الرؤية الآلية أكثر صبرًا وأكثر فطنة. بدلًا من إسقاط الأشخاص بمجرد أن يصعب رؤيتهم أو الثقة العمياء بكل تلميح ضبابي، يسأل النظام باستمرار عن مدى تأكده من كل مسار ويعدِّل سلوكه وفقًا لذلك. تثمر هذه الاستراتيجية في أصعب الظروف: أرصفة مزدحمة، حشود كثيفة، أو مؤدين سريعين الحركة. تقترح الدراسة أن أنظمة التتبُّع المستقبلية—سواء في السيارات أو الطائرات بدون طيار أو الكاميرات—ستكون أكثر موثوقية إذا اعتبرت عدم اليقين إشارة من الدرجة الأولى، تستخدمها لتقرير متى تكون حذرة، ومتى تبحث بجهد أكبر، ومتى تمنح كائنًا شارف على الضياع فرصة أخيرة للبقاء في المشهد.
الاستشهاد: Yang, HS., Park, SW., Sim, CB. et al. Sentinel for confidence-aware multi-object tracking. Sci Rep 16, 13571 (2026). https://doi.org/10.1038/s41598-026-43938-2
الكلمات المفتاحية: تتبُّع متعدد الأجسام, رؤية حاسوبية, كشف الأشياء, معالجة الانسداد, استمرارية المسار