Clear Sky Science · ar
البيانات المفتوحة والمتعلّمون الخصوصيون: مجموعة بيانات مُجهَّلة لنشاط الطلاب وأدائهم لتحليلات التعلم
لماذا تهم عادات دراستك عبر الإنترنت
في كل مرة يقوم فيها الطالب بتسجيل الدخول إلى دورة عبر الإنترنت، أو ينقر على شرائح المحاضرة، أو يقرأ منشورًا في المناقشة، يترك وراءه أثرًا رقميًا. هذه الآثار يمكن أن تكشف من يواجه صعوبات، ومن يتقدم بسهولة، وأي استراتيجيات التدريس فعّالة بالفعل. لكنها أيضًا معلومات شخصية للغاية. تصف هذه المقالة مجموعة بيانات كبيرة مُجهَّلة بعناية لسلوك الطلاب الجامعيين في التعلم عبر الإنترنت تهدف إلى فتح رؤى لتحسين التدريس—دون الكشف عن هويات المتعلّمين الأفراد.

من نقرات الفصل إلى ذهب البحوث
تأتي مجموعة البيانات من طلاب السنة الأولى في برنامج الأعمال بجامعة KU Leuven الذين أخذوا دورتين تمهيديتين—المحاسبة والاقتصاد العالمي—على مدى ثلاث سنوات دراسية، بما في ذلك فترة جائحة كوفيد-19 عندما انتقل الكثير من التدريس إلى الإنترنت. اعتمدت الدورات بشكل كبير على نظام إدارة التعلم، حيث وصل الطلاب إلى قراءات وشرائح واختبارات ومنتديات مناقشة. تم تسجيل كل تفاعل، مثل فتح ملف أو عرض موضوع في المنتدى، بعلامة زمنية. مجتمعةً مع نتائج الامتحانات، توفر هذه السجلات صورة غنية عن كيفية دراسة الطلاب فعليًا على مدى أسابيع وشهور، بدلًا من الاعتماد فقط على أدائهم في يوم الاختبار.
حماية الطلاب أثناء مشاركة البيانات
يثير مشاركة هذا النوع من المعلومات قضايا خصوصية خطيرة: فالسجلات الخام تحتوي على معرفات طلاب فريدة، ودرجات دقيقة، وأوقات نشاط محددة قد تجعل من الممكن إعادة تحديد هوية الأفراد. ولمنع ذلك، طبّق المؤلفون عدة طبقات من إخفاء الهوية قبل نشر مجموعة البيانات. استُبدلت معرفات الطلاب بأكواد عشوائية، وتم تدمير الرابط العائد إلى الهويات الحقيقية. لم تُشارك نتائج الامتحانات كأرقام دقيقة بل جُمعت في نطاقات واسعة مثل راسب، على الحافة، ناجح، أو ممتاز. أُزيلت تفاصيل حول برنامج الدراسة الخاص بالطالب، وصُنِّف عناصر المحتوى في المنصة الإلكترونية إلى أنواع عامة مثل مادة الدورة أو التقييمات بدلًا من الاحتفاظ بأسماء الملفات الأصلية.

تمويه التفاصيل دون فقدان القصة
إزالة الأسماء وحدها لا تكفي لضمان خصوصية قوية، لذلك قامت الفريق أيضًا بتعديل كيف تظهر الزمن والبنية في البيانات. على سبيل المثال، أضافوا تحركًا عشوائيًا طفيفًا لبضع ثوانٍ إلى الطوابع الزمنية لكل طالب. هذا يجعل من الأصعب مطابقة السجلات مع أحداث العالم الحقيقي مع الحفاظ على ترتيب الإجراءات، وهو أمر بالغ الأهمية لدراسة أنماط التعلم. تم إعادة ترقيم منشورات المنتدى ومعرفات الجلسات ومعرفات المحتوى جميعها بشكل عشوائي. ثم تحقق الباحثون من مدى إخفاء الهوية باستخدام مقياس قياسي يُسمى التماثل-ك (k-anonymity)، الذي ينظر إلى عدد الطلاب الذين يشتركون في نفس مجموعة الخصائص. في معظم الحالات، جعلت البيانات المحوّلة الأفراد يندمجون ضمن مجموعات أكبر، معززة حماية الخصوصية.
هل لا تزال البيانات تعكس الواقع؟
بالطبع، لا يكون إخفاء الهوية مفيدًا إلا إذا ظلت البيانات واقعية بما يكفي لدعم بحوث موثوقة. لاختبار ذلك، أعاد المؤلفون بناء عشرات الميزات التعليمية التي استخدمتها دراسات سابقة لاكتشاف أنماط الدراسة غير المعتادة والتنبؤ بنجاح الامتحان. تشمل هذه الميزات عدد مرات تسجيل الدخول، ومدى توازن جلسات الدراسة على مدار الفصل الدراسي، ومدى نشاط استخدام المنتديات. قارن الفريق توزيعات كل ميزة في البيانات الأصلية والمجهّلة باستخدام اختبارات إحصائية. في الغالبية العظمى من الحالات، كانت النسختان غير قابلة للتمييز، مما يعني أن خطوات الخصوصية لم تشوه القصة العامة لكيفية دراسة الطلاب عبر الإنترنت. جاءت الفروقات الطفيفة في أغلبها من تحسينات في كيفية تصنيف أنواع المحتوى، لا من إجراءات الخصوصية نفسها.
ما الذي يمكن للباحثين فعله بها
نظرًا لأن مجموعة البيانات تغطي دورتين مختلفتين وثلاث سنوات—بما في ذلك الاضطراب الكبير أثناء الجائحة—يمكن استخدامها لفحص مدى ثبات النتائج عبر مواد ومجموعات دراسية وظروف متغيرة. تدعم المعلومات الزمنية الدقيقة دراسات استخراج العمليات التي تتبع المسارات النموذجية عبر مواد الدورة، في حين أن سجلات المنتدى الغنية يمكن أن تدعم تحليلات الشبكات الاجتماعية للتفاعل بين الأقران. كما يقدّم المؤلفون رمزًا لإعادة بناء الميزات التعليمية، مما يسهل مقارنة النماذج والأساليب الجديدة مع الأعمال القائمة واستكشاف الذكاء الاصطناعي القابل للتفسير في التعليم.
فتح الأبواب دون فتح الهويات
بعبارات عملية، تُظهر هذه المقالة أنه من الممكن استخلاص الكثير من المعلومات من كيفية نقر الطلاب وتصفحهم للدورات عبر الإنترنت دون كشف هويتهم. من خلال إخفاء التفاصيل الشخصية بعناية مع الحفاظ على الأنماط المهمة، يقدم المؤلفون موردًا عامًا يمكن أن يساعد الجامعات على فهم وتحسين التعلم على نطاق واسع. بالنسبة للطلاب، قد يعني ذلك دعما أذكى وتدريسًا أكثر استجابة—بُني على بيانات، لكن ليس على حساب خصوصيتهم.
الاستشهاد: Tiukhova, E., Van Landuyt, D., Baesens, B. et al. Open data, private learners: a de-identified student activity and performance dataset for learning analytics. Sci Data 13, 548 (2026). https://doi.org/10.1038/s41597-026-06821-3
الكلمات المفتاحية: تحليلات التعلم, خصوصية الطلاب, البيانات التعليمية, التعلّم عبر الإنترنت, إخفاء هوية البيانات