Clear Sky Science · ar
MoSA-Det: كشف الأشياء متكيف مع حالة الحركة لمقاطع الفيديو الرياضية
عيون أكثر حدة على أرض الملعب
عند مشاهدة مباراة مباشرة على التلفاز، يبدو تتبّع كل لاعب والكرة بالأمر السهل للكاميرات والرسوميات. لكن خلف الكواليس، تكافح الحواسيب خصوصاً مع الحركات السريعة. تقدم هذه الورقة طريقة جديدة تجعل الخوارزميات "تراقب" الرياضة بسرعةٍ مواكبة للحركة، وتوفّر تتبّعاً أنظف وأكثر موثوقية لتطبيقات مثل تراكبات البث والتحليل التكتيكي والتدريب.

لماذا تخلط الحركة السريعة الحواسيب
تمتلئ مقاطع الفيديو الرياضية بالاندفاعات السريعة، والتمريرات الطويلة، وحركات الكاميرا الواسعة. بالنسبة لأنظمة الرؤية الحاسوبية، ينتج عن ذلك مشكلتان رئيسيتان. أولاً، عندما تتحرك اللاعبين أو الكرة بسرعة، تتعرض الصورة للضبابية، وتفقد الحواف والملمس الذي تعتمد عليه الكواشف. يبيّن المؤلفون أنه في هذه الحالات تضعف الإشارات الرقمية داخل الشبكة وتصبح أقل استقراراً، فيصبح النظام أقل يقيناً بما يراه. ثانياً، تحاول العديد من طرق الفيديو الحديثة تحسين القرار بدمج معلومات من عدة إطارات مجاورة. هذا يعمل جيداً إذا تحرّك الشيء قليلاً بين الإطارات، لكن في الرياضات السريعة قد تقفز المواقع كثيراً بحيث لا تتوافق، فإضافة إطارات أكثر قد تُدخل ضوضاء وتقلل الدقة.
نظام يتكيف مع الحركة
يقترح الباحثون MoSA-Det، إطار عمل يغيّر طريقة معالجة كل منطقة في الصورة اعتماداً على سرعتها. بدلاً من معاملة كل بكسل بنفس الطريقة، يقدّر النظام أولاً "حالة" الحركة لكل موقع، ويصنّفها إلى ثابتة أو بطيئة أو سريعة. يفعل ذلك بمقارنة الميزات بين الإطارات المتتالية وتحليل مدى تطابقها مع المناطق المجاورة. ثم يوجّه خريطة الحركة هذين المكوّنين الرئيسيين: واحد يركز على تحسين وضوح ما يُرى في إطار واحد، وآخر يقرر مقدار الثقة بالمعلومات من الإطارات الأخرى عبر الزمن.
تنقية اللاعبين والكرات الضبابية
المكوّن الأول، المسمى وحدة الميزات التكيفية المدركة للحركة، يتعامل مع مشكلة الضبابية داخل الإطارات الفردية. يمرّر كل نطاق عبر عدة فروع تفحص جواراً بمقاييس مختلفة، من التفاصيل المحلية جداً إلى منطقة محيطة أوسع. تُخبر خريطة الحركة الشبكة كيفية مزج هذه المناظير: المناطق البطيئة أو الثابتة تعتمد أكثر على الأجواء الصغيرة للحفاظ على التفاصيل الدقيقة، بينما تميل المناطق السريعة إلى الاعتماد على رؤى أوسع تجمع المعلومات المبعثرة. بالنسبة لأسرع المناطق، مثل الكرة الطائرة، تُفعّل الوحدة فرعاً خاصاً يتعلّم "ثني" شبكة العيّنات الخاصة به ليتبع الأشكال المشوّهة بشكل أفضل، مما يساعد على استعادة إشارات مفيدة حتى تحت ضبابية قوية.

استخدام الزمن فقط عندما يفيد
المكوّن الثاني، وحدة التجميع الزمني الموجهة بالحالة، يقرر كيفية دمج المعلومات عبر الإطارات دون السماح لسوء التوافق أن يسبب ضرراً. يستخدم خريطة الحركة لضبط الأوزان على الإطارات السابقة والمقبلة لكل موضع. في المناطق الثابتة، يمزج عدة إطارات بشكل متوازن إلى حد ما، مما يقلل الضوضاء ويجعل الاكتشافات أكثر استقراراً. في المناطق سريعة الحركة، يركّز الوزن على الإطار الحالي ويستخدم انزلاقات متعلمة لمحاولة محاذاة الإطارات الأقدم تقريبياً قبل خلطها، وحتى في هذه الحالة يدمجها بحذر. فرع صغير إضافي أيضاً يدفع الصناديق المحيطة النهائية لتصحيح الطريقة التي قد تحوّل فيها الضبابية مركز الشكل الظاهر.
ماذا تعني النتائج لتقنيات الرياضة
مجرّباً على مجموعتي بيانات كبيرتين لمقاطع الفيديو الرياضية في كرة القدم وكرة السلة والكرة الطائرة، يتفوّق MoSA-Det باستمرار على طرق قوية حالية. يكتشف اللاعبين والكرة بدقة أكبر، خصوصاً في المشاهد المزدحمة، وتحت حركة كثيفة، وعند حدود دقة أشد تتطلب محيطات دقيقة للغاية. والأهم أنه ما زال يعمل بسرعة كافية للبث في الوقت الحقيقي. بالنسبة للقارئ العادي، الرسالة الأساسية هي أن هذا النظام يعلّم الحواسيب أن تولي اهتماماً مختلفاً للحركة البطيئة والسريعة بدلاً من اتباع نهج واحد يناسب الجميع، مما يؤدي إلى تتبّع أنظف ورسوميات أكثر موثوقية أثناء اللعب عالي السرعة.
الاستشهاد: Yang, L., Sun, W. & Ren, J. MoSA-Det: motion state adaptive object detection for sports videos. Sci Rep 16, 15969 (2026). https://doi.org/10.1038/s41598-026-43231-2
الكلمات المفتاحية: كشف مقاطع الفيديو الرياضية, تتبّع الأشياء, ضبابية الحركة, رؤية حاسوبية, التعلم العميق