Clear Sky Science · ar

خط أنابيب CNN–Bi-LSTM ومجموعة بيانات FSW المفتوحة للتعرّف على حركات المصارعة الحرة

· العودة إلى الفهرس

تعليم الحواسيب مراقبة المصارعة

المصارعة الحرة سريعة ومعقّدة ومربكة للمشاهدة—حتى بالنسبة للبشر. وللحواسيب، التفريق بين رمية وأخرى في حلبة مزدحمة أصعب بكثير. تُظهر هذه الدراسة كيف أن خط أنابيب فيديو مصمّم بعناية ومجموعة بيانات عامة جديدة يمكن أن يساعد الآلات على التعرّف على تقنيات مصارعة محددة، مما يفتح الباب أمام تحليلات رياضية أذكى، وأدوات تدريب، وتوليد مقتطفات تلقائية للمباريات.

تحدي الرياضات ذات الاتصال القريب

تم تدريب معظم أنظمة التعرّف على الفيديو الحديثة على مقاطع يظهر فيها الأشخاص منفصلين نسبيًا وسهل رؤيتهم، مثل الجري أو تأرجح مضرب التنس. المصارعة الحرة مختلفة: الرياضيون ملتصقون ببعضهم، والأطراف تتداخل، والمشهد مليء بمشتتات من الحكام والحلبة والجماهير المشجعة. لا تعكس المعايير القياسية هذا التعقيد، لذا غالبًا ما تتعثر الطرق التي تؤدي جيدًا في أفعال الحياة اليومية عندما يتشابك المصارعون ويلتفّون بسرعة.

بناء مكتبة جديدة لحركات المصارعة

لمعالجة هذه الفجوة، أنشأ المؤلفون مجموعة بيانات Open FSW، وهي مجموعة منسقة تضم 210 مقطعًا قصيرًا من المصارعة الحرة. يظهر كل مقطع حركة كاملة واحدة فقط، مختارة من سبع تقنيات محددة جيدًا مثل رميات الورك، وواجهات الساق، والتمرّغات الدوّارة. تأتي المقاطع من مصدرين: جلسات تدريب خاضعة للرقابة مع مجموعة صغيرة من الرياضيين، ومباريات مُذاعة من مسابقات عامة، مما يضيف تنوعًا في زاوية الكاميرا والإضاءة وفوضى الخلفية. ساعد الخبراء والحكام في تسمية كل مقطع، وتقسَّمت مجموعة البيانات بحيث لا تظهر مقاطع من نفس المباراة أو جلسة التدريب في كلٍ من التدريب والاختبار، مما يقلّل من خطر المبالغة في تقدير الأداء.

Figure 1
الشكل 1.

التركيز على المصارعين، لا الجمهور

جوهر النهج هو تعليم الحاسوب "الانتباه" إلى المصارعين وتجاهل الباقي إلى حد كبير. يمر كل إطار فيديو أولاً عبر نموذج تجزئة يفصل الرياضيين عن الخلفية وينتج ظلالًا أمامية نظيفة. تُعالَج هذه الإطارات الأمامية بعد ذلك بواسطة شبكة صور عميقة تضغط كل صورة إلى متجه خصائص مضغوط—خلاصة رقمية لأشكال المصارعين ومواقعهم في تلك اللحظة. أخيرًا، ينظر نموذج تسلسلي ثنائي الاتجاه إلى سلسلة ملخّصات الإطارات بأكملها، من البداية إلى النهاية وبالعكس، ليقرر أي من التقنيات السبع تُنفّذ في المقطع.

مدى اتقان النظام لتعلّم الحركات

اختبر الباحثون عدة مُشفّرات صور شعبية وقارنوا خط الأنابيب الواعي بالمقدمة بطرق سابقة تعتمد أساسًا على مخططات الهيكل العظمي للرياضيين. تكوينهم الأفضل، الذي يجمع بين تجزئة مُعادة الضبط مع بنية EfficientNet للصورة ونموذج تسلسلي، يتعرف بشكل صحيح على الحركة في حوالي 83 بالمئة من المقاطع. هذا تحسّن واضح مقارنةً بقاعدة قوية قائمة على الهيكل العظمي وبنسخ من نظامهم تتخطى خطوة المقدمة. كانت المكاسب أقوى للحركات التي يتداخل فيها الجسمان بشدة وتكون الخلفية مشتتة بشكل خاص. تؤكد الاختبارات الإحصائية عبر طيات متعددة من البيانات أن هذه التحسينات من غير المحتمل أن تكون نتيجة الصدفة.

Figure 2
الشكل 2.

المقايضات والقيود والأثر الأوسع

التركيز على المصارعين له تكلفة: إضافة خطوة تجزئة تقريبًا تضاعف زمن المعالجة لكل مقطع على العتاد المختبر. للتحليل غير الفوري—مثل تحليلات ما بعد المباراة أو الدراسات البحثية—هذا العبء مقبول، لكن التطبيقات الزمنية الحقيقية قد تحتاج نماذج تجزئة أسرع أو أجهزة أقوى. تشير الدراسة أيضًا إلى أن مجموعة البيانات صغيرة نسبيًا، وهو ما واجهوه بالتعلّم النقلي وتوسيع البيانات، وأن التجزئة يمكن أن تواجه صعوبة تحت ضبابية حركة شديدة أو انسداد شديد.

ماذا يعني هذا للمشجعين والمدرّبين

بعبارات بسيطة، تُظهر هذه العمل أن تنظيف ما تراه الحاسوب—بقص المصارعين من المشهد المزدحم قبل تحليل الحركة—يجعله أفضل بكثير في تسمية الحركات المحددة. بينما النتائج الحالية مصممة للمصارعة الحرة، يمكن أن تُطبّق الفكرة نفسها على رياضات الاتصال القريب الأخرى مثل الجودو أو الجيو-جيتسو البرازيلي. من خلال إصدار كل من مجموعة البيانات والكود، يوفّر المؤلفون أساسًا للأنظمة المستقبلية التي يمكنها تحليل تبادلات المصارعة المعقّدة تلقائيًا، مما يساعد المدربين والرياضيين والمشجعين على فهم ما يحدث على الحلبة بشكل أفضل.

الاستشهاد: Rostamian, M., Mottaghi, A. & Soryani, M. A CNN–Bi-LSTM pipeline and open FSW dataset for freestyle wrestling action recognition. Sci Rep 16, 14632 (2026). https://doi.org/10.1038/s41598-026-44782-0

الكلمات المفتاحية: المصارعة الحرة, التعرّف على الحركات, تحليلات الرياضة, الرؤية الحاسوبية, التعلّم العميق