Clear Sky Science · ar

تطبيق LSTM-CNN في التعرف على حركات التزلج تحت تقنية الذكاء الاصطناعي

· العودة إلى الفهرس

تدريب أذكى على المنحدرات

يتجه المتزلِّجون والمدرِّبون والجمهور بشكل متزايد إلى الفيديو لفهم ما يحدث في منعطف أو قفزة تستغرق أجزاء من الثانية. ومع ذلك في العالم الواقعي، تجعل رشات الثلج والأشجار وتغيُّر الإضاءة والمنحدرات المزدحمة من الصعب على الحواسب التعرف بثقة على ما يفعله المتزلِّج. تقدم هذه الورقة نظام ذكاء اصطناعي جديدًا يمكنه قراءة تقنية التزلج تلقائيًا من فيديوهات عادية بدقة عالية، حتى في ظروف خارجية فوضوية. قد تُدعم هذه التقنية يومًا ما أدوات تدريب في الوقت الحقيقي، وتدريبًا أكثر أمانًا، وتحليلات أداء أعمق للرياضات الشتوية.

لماذا تعليم الحواسب رؤية التزلج صعب

تحليل التزلج رياضة متطلبة لأن الحركات سريعة وثلاثية الأبعاد وغالبًا ما تكون مخفية جزئيًا بملابس سميكة أو بجسم المتزلج نفسه. في الوقت نفسه، المشاهد الخارجية مليئة بالمشتتات: أشجار، تلال ثلجية، انعكاسات قوية، وطقس متغير. أنظمة الفيديو السابقة إما ركَّزت كثيرًا على المظهر الثابت في إطار واحد أو فشلت في تتبُّع كيفية تطور الحركات عبر الزمن بشكل صحيح. ونتيجة لذلك، كانت تميل إلى الخلط بين حركات متشابهة، وتواجه صعوبة في الرؤية الضعيفة، ولم تكن قوية عند مواجهة رياضيين أو ظروف منحدر جديدة.

Figure 1
الشكل 1.

رؤية مزدوجة لحركة التزلج

صمَّم المؤلفون نموذجًا يراقب فيديوهات التزلج بطريقتين متكاملتين في آن واحد. «عين» واحدة تنظر إلى الإطارات الملونة العادية، لالتقاط مظهر المتزلج والمحيط. و«العين» الأخرى تركز على الحركة بتتبع كيفية انتقال البكسلات من إطار إلى آخر، تقنية تعرف بالتدفق البصري. من حقل الحركة هذا، يبني النظام خريطة بروز تُبرز المناطق الفعلية النشطة — الزلاجات، الساقان والجذع — مع تقليل أهمية الخلفية الثابتة مثل الأشجار وحواف الثلج. يمر كلا المسارين عبر شبكة تلافيفية ثلاثية الأبعاد تتعلم أنماطًا عبر المكان والفترات الزمنية القصيرة، مُجمِّعة كل مقطع فيديو إلى توقيعات مدمجة للمظهر والحركة.

دمج ما يراه وكيف يتحرك

بدلاً من مجرد تكديس أو متوسط تدفقات المعلومات، يتعلم النموذج مقدار الثقل الذي يجب منحه لكل منهما لكل مقطع يحلله. لبعض المناورات، مثل فرملة المحراث حيث تشكل الزلاجات شكلًا مميزًا، تكون دلائل المظهر أكثر أهمية. في المنعطفات المتوازية الناعمة، يكون إيقاع الحركة واتجاهها أكثر إفادة. وحدة دمج قابلة للتعلُّم تضبط هذه المساهمات تلقائيًا، مع تطبيع مجموعتي الميزات ودمجهما عبر أوزان مدرَّبة دائمًا ما تجمع إلى واحد. يتيح هذا المزيج التكيفي للنظام التركيز على أي دليل بصري هو الأكثر إخبارًا عن الحركة الحالية، مما يجعل التعرف أدق وأكثر موثوقية عبر أنماط ومشاهد تزلج متنوعة.

Figure 2
الشكل 2.

قراءة القصة الكاملة لكل انعطاف

التعرُّف على حركة في التزلج ليس مجرد وضعية واحدة؛ بل هو كيف يتكشف التسلسل من البداية إلى النهاية. لالتقاط ذلك، تُغذى الميزات المدموجة إلى شبكة متكررة ثنائية الاتجاه تنظر للأمام والخلف في الزمن. بدلاً من الاعتماد فقط على الإطارات الماضية، يستخدم النموذج أيضًا تلميحات من الإطارات القادمة لفهم ما يفعله المتزلج. يساعد هذا على التمييز بين حركات قد تبدو متشابهة في لقطة لحظية لكنها تختلف في التوقيت والتنسيق. أظهرت الاختبارات على مجموعة SkiTB — مجموعة كبيرة من فيديوهات التزلج الواقعية — أن النظام الجديد يتفوق على عدة طرق معروفة، محققًا نحو 93% في الدقّة ومعدل F1. ويظل فوق 85% دقة حتى عند تقييمه في ظروف جوية مختلفة، أو على رياضيين غير مألوفين، أو فيديوهات تحتوي على ضجيج صناعي.

ما يعنيه ذلك للمتزلجين وتقنية الرياضة

بجمع إدراك حركة مركز، ودمج تكيفي للدلائل البصرية، وقراءة واعية زمنياً للحركة، يمكن للنموذج المقترح أن يحدد بثقة ما إذا كان المتزلج ينعطف أو يفرمل أو يقفز، حتى في بيئات مزدحمة ومتغيرة. للخلاصة لغير المتخصصين، النظام لا يكتفي بعدّ الإطارات؛ بل يتعلم أين ينظر، وما الذي يهم أكثر، وكيف تدور دورة الحركة كاملة. يمكن أن يشكل هذا النهج العمود الفقري لمساعدي تدريب ذكيين يقدمون تغذية راجعة موضوعية، ويساعدون على منع الإصابات عبر اكتشاف أنماط خطرة، ويدعمون تحليلات بثّ أغنى. ومع أن المؤلفين يشيرون إلى أن الطقس القاسي والحركات الجوية القصيرة جدًا لا تزال تمثل تحديًا، فإن إطارهم يوفر أساسًا قويًا لأدوات تدريب ذكية مستقبلية في التزلج وربما في العديد من الرياضات الخارجية الأخرى.

الاستشهاد: Zhang, W., Xu, L. & Wang, L. Application of LSTM-CNN in skiing action recognition under artificial intelligence technology. Sci Rep 16, 11547 (2026). https://doi.org/10.1038/s41598-026-42324-2

الكلمات المفتاحية: التعرف على حركات التزلج, تحليل فيديوهات الرياضة, التعلم العميق, التدفق البصري, أداء الرياضيين