Clear Sky Science · ar

التحليل التنبؤي لمشاركة الطلاب في مقررات التربية البدنية الجامعية استنادًا إلى خوارزمية محول متعدد الوسائط

2026-03-26 · العودة إلى الفهرس

لماذا يهم هذا للطلاب والمعلمين

من المفترض أن تعزز حصص الرياضة الجامعية اللياقة البدنية، وتبني عادات ممارسة جيدة، وتحسّن المزاج، ومع ذلك لا تزال العديد من الصالات والملاعب تشهد حضورًا منخفضًا ومشاركة غير جادة. تُظهر هذه الدراسة كيف يمكن دمج بيانات من أجهزة قابلة للارتداء وكاميرات الفصل وتعليقات قصيرة مكتوبة لتقدير مدى انخراط الطلاب تلقائيًا أثناء حصص التربية البدنية، مما يمنح المعلمين رؤية أسرع وأكثر موضوعية مقارنة بقوائم المراجعة التقليدية أو استبيانات نهاية الفصل.

تحويل حصص الرياضة إلى تدفقات بيانات غنية

في دورات التربية البدنية الحديثة، غالبًا ما يرتدي الطلاب أجهزة تتعقب معدل ضربات القلب والخطوات والحركة، في حين تلتقط الكاميرات أنشطة المجموعة وتجمع المنصات الإلكترونية رسائل وتعليقات قصيرة. يستفيد الباحثون من مجموعة بيانات وطنية كبيرة تجمع هذه التدفقات معًا لآلاف ساعات من الحصص على ألف طالب جامعي. تُوسَم كل قطعة زمنية مدتها عشر دقائق من الحصة بواسطة خبراء مدرّبين لتصنيفها كمشاركة منخفضة أو متوسطة أو عالية، استنادًا إلى كيفية حركة الطلاب، ومدى إجهاد أجسامهم، وما يقولونه عن الدرس. تصبح هذه الشرائح الموسومة أرضية تدريب لنموذج حاسوبي يتعلم قراءة المشاركة من البيانات الخام بدلاً من الانطباعات المتفرقة.

Figure 1. تجمع بيانات الأجهزة القابلة للارتداء والكاميرات والتعليقات لمتابعة مدى انخراط الطلاب في حصص الرياضة.

تدريب نموذج لقراءة الجسد والوجه والكلمات

بدلًا من الاعتماد على مصدر واحد للمعلومات، يبني البحث نموذجًا متعدد الطبقات يعامل المستشعرات والنص والفيديو كشركاء متكافئين. بالنسبة لإشارات المستشعر مثل معدل ضربات القلب والتسارع، تتعلم شبكة معالجة التسلسل اكتشاف أنماط مثل الجهد المستمر أو اندفاعات النشاط المتكررة. بالنسبة لتعليقات الطلاب وتأملاتهم القصيرة، يستخلص نموذج لغوي الجمل الكاملة إلى تمثيلات مدمجة تُشفّر الموقف والنبرة. بالنسبة لمقاطع الفيديو، تكسر شبكة أخرى كل إطار إلى رقع وتتعلم كيف تتكشف تعابير الوجه ووضعية الجسد وأنماط الحركة عبر الزمن. تُترجم هذه التدفقات الثلاثة بعد ذلك إلى فضاء رقمي مشترك حتى يتمكن النموذج من مقارنتها ودمجها بفعالية.

كيف يربط النموذج الإشارات بالمشاركة

جوهر النهج هو تقنية تسمح لتدفقات البيانات المختلفة بالانتباه إلى بعضها البعض. أولًا، يقوّي النموذج كل تدفق على حدة، متعلمًا البنية الداخلية مثل الاتجاهات في معدل ضربات القلب أو اللحظات الحاسمة في الفيديو. بعد ذلك، يربط بين التدفقات، ويطرح أسئلة مثل أي الفترات الزمنية في بيانات المستشعر تتطابق مع الذِكْر المكتوب للشعور بالتعب، أو أي مقاطع الفيديو تتوافق مع لغة توحي بالحماس. من خلال تعلم هذه الروابط المتقاطعة، يبني النظام صورة مدمجة عما يحدث مع كل طالب خلال نافذة زمنية مدتها عشر دقائق. أخيرًا، تُغذَّى هذه الصورة المجمعة إلى طبقة إخراج بسيطة تنتج كلًا من درجة مشاركة مستمرة وفئة بثلاث مستويات.

Figure 2. تتدفق الإشارات من المستشعرات والفيديو والنص عبر كتل متعددة الطبقات لتصنيف الطلاب إلى مشاركة منخفضة أو متوسطة أو عالية.

مدى فعالية النظام عمليًا

عندما يقارن الباحثون نموذجهم متعدد الوسائط مع مجموعة من الطرق القائمة التي تستخدم المستشعرات فقط أو الفيديو فقط أو نوعين من البيانات فقط، يجدون تحسّنات واضحة. يخفض النظام الجديد خطأ التنبؤ بأكثر من الخُمُس مقارنة بخط أساس قوي قائم على المستشعرات فقط ويصل إلى أكثر من 90 بالمئة دقة في تصنيف مستويات المشاركة. والأهم أنه يفعل ذلك بسرعة كافية لتكون مفيدة أثناء الحصة، حيث يحتاج نحو عشرين جزءًا من الثانية لمعالجة عشر دقائق من البيانات لطالب واحد. تُظهر اختبارات تزيل نوعًا واحدًا من البيانات في كل مرة أن المصادر الثلاثة كلها قيّمة، مع مساهمة الفيديو الأكبر، تليه النص ثم المستشعرات. يشير تحليل إضافي لأنماط الانتباه الداخلية للنموذج إلى أنه يركز على مؤشرات معقولة، مثل ربط ارتفاع معدل ضربات القلب بالحركة النشطة والإرهاق اللاحق.

ماذا قد يعني هذا لحصص الرياضة المستقبلية

يخلص المؤلفون إلى أن نظامًا متعدد الوسائط مصممًا بعناية يمكن أن يوفر صورًا فورية ودقيقة إلى حدٍ معقول عن انخراط الطلاب في التربية البدنية، محركًا التقييم بعيدًا عن الانطباعات التقريبية نحو رؤية مستمرة مدفوعة بالبيانات. ومع أن النهج يعتمد على الكاميرات والأجهزة القابلة للارتداء ويثير تساؤلات حول الخصوصية والعدالة، إلا أنه يشير إلى مستقبل يتلقى فيه المعلمون تغذية راجعة فورية عن متى يكون الطلاب مركزين أو متحمسين أو مشتتين، ويمكنهم تعديل الأنشطة على الفور بدلًا من الانتظار لاستبيانات نهاية الفصل.

الاستشهاد: Li, J. Predictive analysis of student engagement in university physical education courses based on a multimodal transformer algorithm. Sci Rep 16, 15123 (2026). https://doi.org/10.1038/s41598-026-45928-w

الكلمات المفتاحية: مشاركة الطلاب, التربية البدنية, التعلم متعدد الوسائط, نموذج المحول, أجهزة استشعار قابلة للارتداء